1.Apache Ranger整合Hadoop、源译Hive、码编Spark实现权限管理
2.HUE从安装到塌方
3.电脑页面的源译什么特效?
4.Seurat 4 源码解析 8: step4 QC可视化 VlnPlot()
Apache Ranger整合Hadoop、Hive、码编Spark实现权限管理
在先前的源译文章《说说PB级生产上重要的Spark 3.x性能优化方向》中,提到了业务人员在处理数据时可能因误操作而造成数据损坏的码编编程猫源码精灵限时解码问题。在许多场景中,源译数仓需要直接开放给业务分析人员使用,码编他们经常执行SQL进行场景分析和验证。源译为此,码编可以提供一个WebUI供他们使用,源译如Hue。码编然而,源译由于数仓数据庞大,码编不可能全部开放给业务人员,源译因此对外供数时必须提供权限控制。
权限控制方面,CDH上提供的Sentry是一个不错的选择,它基于RBAC进行授权,可以针对库、表等设置不同用户权限。CM的加入使得Sentry的配置变得简单,但Sentry在用户管理方面较为繁琐,且项目已进入Apache Attic,因此选择Sentry并非明智之举。
实际上,许多公司的生产环境都是外网隔离的,特别是modbuspoll源码涉及敏感数据的小猴公司。开发、运维人员进入生产环境需要经过严格的校验,接入公司的生产专用网络,并通过堡垒机,任何人都无法导出数据,且每个操作都有审计跟踪。尽管如此,业务人员仍需开放访问,尽管他们通过专门的跳板机访问,但依然存在风险。
Apache Ranger只要有大数据集群的地方就都需要。本文解决了Ranger不支持Spark SQL的问题,实现了库、表、行、列级别的细粒度权限控制。由于官方文档和百度文档有限,本文将分享相关信息,希望能帮助到大家。
Apache Ranger是一个用于Hadoop平台上的权限框架,旨在服务于整个大数据生态圈。随着Hadoop在数据湖领域方案的成熟,对数据权限控制的要求也日益提高。Ranger现在提供了更多对大数据生态组件的支持。
Hadoop中的数据访问多样化,如存储在HDFS的数据可以被Hive、Spark或Presto访问。Rc源码这么多组件访问数据,若不进行集中权限控制,数据安全性将面临严重问题。因此,大数据平台通常需要一个集中管理权限的组件或框架,Ranger正是这样的组件。
当前Ranger版本为2.1,官方提供的版本为2.1。编译测试基于Ranger 2.1版本。官方未提供安装包,需要手动下载Ranger源码包进行编译。编译环境要求提前安装,具体可参考官方网站。
编译成功后,将tar.gz包拷贝到本地。部署Ranger Admin的安装方式与Ranger类似:安装Ranger admin、创建ranger用户并设置密码、上传解压安装包、拷贝MySQL JDBC库、在MySQL中创建ranger库和用户、初始化配置、初始化Ranger admin。若显示成功,则表示初始化成功。在MySQL中可以看到ranger数据库中已创建大量表。
配置Ranger设置数据库密码、配置环境变量、反码源码启动Ranger admin访问web UI。登录后,主界面显示如下。点击右上角的“Swith to latest UI”可以切换到最新的UI展示。若安装过程中出现问题,请检查日志。
安装Ranger usersync配置admin认证模式。Ranger中admin的认证方式有三种:Unix、Active Directory、Kerberos。此处使用Unix方式进行认证,意味着后续Ranger admin登录会按照Linux中的认证同步。上传解压Ranger usersync组件、修改初始化配置、初始化配置、配置Linux系统用户组同步配置环境变量、启动usersync服务、修改Ranger admin的认证方式、重新启动Ranger admin。在ranger-admin中可以看到所有Linux中的所有用户。
安装Ranger HDFS插件。注意,HDFS插件需要安装在NameNode对应的节点中,YARN插件需要安装在ResourceManager对应的节点上。解压HDFS插件、初始化配置、启用hdfs插件。netasp源码Ranger HDFS插件会将当前的配置文件保存备份。可以查看ranger对这些配置文件的更改。
在PM中添加HDFS服务、配置HDFS服务权限策略、默认策略、策略配置、测试用户访问权限、在ranger中添加组合用户、基于角色授权、测试。我们发现,只要Ranger中的权限已更新,hdfs客户端就可以实现更新。
按照之前的配置,审计日志信息保存在指定目录。找到一条审计日志,查看其中的内容。审计日志中包含操作时间、路径、资源类型、对应Ranger中的策略等信息。一旦出现安全类问题,通过审计日志可以检查到进行了哪些操作。
部署Ranger HDFS HA。在HDFS的HA集群上,NameNode可能会发生failover,因此非常有必要在每个HDFS的NameNode上部署一个HDFS插件,以确保在HA切换时能够正常控制权限。部署hdfs plugin到每个NameNode节点、初始化NameNode、测试NameNode节点权限。测试lisi用户在/tmp目录的写入权限,发现当前lisi没有写入权限。在Ranger中启用sales角色的用户具备/tmp目录可写权限。重新执行写入操作,NameNode接入Ranger权限控制成功。
部署Ranger框架整合Hive、上传解压Hive插件、初始化配置、启动Hive插件。Ranger会对Hive的配置文件进行处理,生成hiveserver2-site.xml、ranger-hive-audit.xml、ranger-hive-security.xml等文件。重新启动Hive、beeline登录到hive、在PM中添加Hive服务、添加Hive Service、查看权限策略、查看默认hive导入的权限、使用hive查看数据、给hadoop组用户授权、检查spark用户操作权限、授权hadoop组、对某个库、表、列设置细粒度权限、测试数据打码处理、测试Ranger Admin crash对Hive的影响、部署Ranger Spark SQL、编译Apache submarine spark-security模块、配置、配置Spark SQL、测试Thrift Server、测试Spark SQL SHELL、到此Ranger整合Spark SQL完成、查看spark sql审计日志、报错信息处理、找不到AllocationFileLoaderService$Listener、异常信息、解决办法、参考文献。
HUE从安装到塌方
Hue:集成界面的友好选择 作为一个功能强大的界面集成框架,Hue旨在将我们学习和即将接触的各种框架整合在一个简洁的界面中,使得数据处理和监控变得易如反掌。它拥有类似的竞争产品如Apache Zeppelin。 安装Hue的过程相对复杂,官方并未提供预编译的安装包。为了确保顺利安装,建议在没有安装过MySQL的节点上操作,以避免版本冲突。以下是在Linux系统上安装Hue的详细步骤:首先,你需要下载两个软件包:hue-release-4.3.0.zip和apache-maven-3.6.3bin.tar.gz,然后将它们上传并解压。
接下来,确保安装必要的依赖包,这对于构建Hue环境至关重要。
安装Maven,这是Hue构建和管理项目所依赖的构建工具。
然后,开始Hue的编译过程,将源代码转换为可执行的程序。
配置Hadoop,确保Hue能与Hadoop生态系统无缝协作。
最后,对Hue进行个性化配置,并启动服务,完成集成环境的搭建。
一旦Hue成功整合了HDFS、YARN、Hive以及MySQL,你可以重启Hue服务,开始享受集成后的高效数据分析体验。电脑页面的什么特效?
这个是html5的效果,以下是源代码:
<!DOCTYPE html>
<html xmlns="/texiao/html5/index/hovertreewelcome.css" type="text/css" rel="stylesheet" />
</head>
<body ondragstart="window.event.returnValue=false" oncontextmenu="window.event.returnValue=false" onselectstart="event.returnValue=false">
<div id="hovertreecontainer">
<div>
<h1 id="h1">何问起 </h1>
<h2 id="h2"> 想问候,不知从何问起,就直接说喜欢你!</h2>
<h3 id="h2">hovertree.com为您提供前端特效,ASP.NET等设计开发资料。<a href="/hvtart/bjae/onxw4ahp.htm">原文</a> <a href="/texiao/">特效</a></h3>
<p> </p>
<p><strong><a href="/">进入主站</a></strong></p>
<p> </p>
<p> </p>
<p> </p>
<p> </p>
<p> </p>
</div>
</div>
<canvas id="canvas"></canvas>
<audio autoplay="autoplay">
<source src="" type="audio/ogg">
<source src="/hovertreesound/hovertreexihuanni.mp3" type="audio/mpeg">
您的浏览器不支持播放音乐。请用支持html5的浏览器打开,例如chrome或火狐或者新版IE等。
<br />何问起 hovertree.com
</audio><script type="text/javascript" src="/texiao/html5/index/hovertreewelcome.js">
</script>
<script type="text/javascript">
; (function (window) {
var ctx,
hue,
logo,
form,
buffer,
target = { },
tendrils = [],
settings = { };
settings.debug = true;
settings.friction = 0.5;
settings.trails = ;
settings.size = ;
settings.dampening = 0.;
settings.tension = 0.;
Math.TWO_PI = Math.PI * 2;
// ========================================================================================
// Oscillator 何问起
// ----------------------------------------------------------------------------------------
function Oscillator(options) {
this.init(options || { });
}
Oscillator.prototype = (function () {
var value = 0;
return {
init: function (options) {
this.phase = options.phase || 0;
this.offset = options.offset || 0;
this.frequency = options.frequency || 0.;
this.amplitude = options.amplitude || 1;
},
update: function () {
this.phase += this.frequency;
value = this.offset + Math.sin(this.phase) * this.amplitude;
return value;
},
value: function () {
return value;
}
};
})();
// ========================================================================================
// Tendril hovertree.com
// ----------------------------------------------------------------------------------------
function Tendril(options) {
this.init(options || { });
}
Tendril.prototype = (function () {
function Node() {
this.x = 0;
this.y = 0;
this.vy = 0;
this.vx = 0;
}
return {
init: function (options) {
this.spring = options.spring + (Math.random() * 0.1) - 0.;
this.friction = settings.friction + (Math.random() * 0.) - 0.;
this.nodes = [];
for (var i = 0, node; i < settings.size; i++) {
node = new Node();
node.x = target.x;
node.y = target.y;
this.nodes.push(node);
}
},
update: function () {
var spring = this.spring,
node = this.nodes[0];
node.vx += (target.x - node.x) * spring;
node.vy += (target.y - node.y) * spring;
for (var prev, i = 0, n = this.nodes.length; i < n; i++) {
node = this.nodes[i];
if (i > 0) {
prev = this.nodes[i - 1];
node.vx += (prev.x - node.x) * spring;
node.vy += (prev.y - node.y) * spring;
node.vx += prev.vx * settings.dampening;
node.vy += prev.vy * settings.dampening;
}
node.vx *= this.friction;
node.vy *= this.friction;
node.x += node.vx;
node.y += node.vy;
spring *= settings.tension;
}
},
draw: function () {
var x = this.nodes[0].x,
y = this.nodes[0].y,
a, b;
ctx.beginPath();
ctx.moveTo(x, y);
for (var i = 1, n = this.nodes.length - 2; i < n; i++) {
a = this.nodes[i];
b = this.nodes[i + 1];
x = (a.x + b.x) * 0.5;
y = (a.y + b.y) * 0.5;
ctx.quadraticCurveTo(a.x, a.y, x, y);
}
a = this.nodes[i];
b = this.nodes[i + 1];
ctx.quadraticCurveTo(a.x, a.y, b.x, b.y);
ctx.stroke();
ctx.closePath();
}
};
})();
// ----------------------------------------------------------------------------------------
function init(event) {
document.removeEventListener('mousemove', init);
document.removeEventListener('touchstart', init);
document.addEventListener('mousemove', mousemove);
document.addEventListener('touchmove', mousemove);
document.addEventListener('touchstart', touchstart);
mousemove(event);
reset();
loop();
}
function reset() {
tendrils = [];
for (var i = 0; i < settings.trails; i++) {
tendrils.push(new Tendril({
spring: 0. + 0. * (i / settings.trails)
}));
}
}
function loop() {
if (!ctx.running) return;
ctx.globalCompositeOperation = 'source-over';
ctx.fillStyle = 'rgba(8,5,,0.4)';
ctx.fillRect(0, 0, ctx.canvas.width, ctx.canvas.height);
ctx.globalCompositeOperation = 'lighter';
ctx.strokeStyle = 'hsla(' + Math.round(hue.update()) + ',%,%,0.)';
ctx.lineWidth = 1;
if (ctx.frame % == 0) {
console.log(hue.update(), Math.round(hue.update()), hue.phase, hue.offset, hue.frequency, hue.amplitude);
}
for (var i = 0, tendril; i < settings.trails; i++) {
tendril = tendrils[i];
tendril.update();
tendril.draw();
}
ctx.frame++;
ctx.stats.update();
requestAnimFrame(loop);
}
function resize() {
ctx.canvas.width = window.innerWidth;
ctx.canvas.height = window.innerHeight;
}
function start() {
if (!ctx.running) {
ctx.running = true;
loop();
}
}
function stop() {
ctx.running = false;
}
function mousemove(event) {
if (event.touches) {
target.x = event.touches[0].pageX;
target.y = event.touches[0].pageY;
} else {
target.x = event.clientX
target.y = event.clientY;
}
event.preventDefault();
}
function touchstart(event) {
if (event.touches.length == 1) {
target.x = event.touches[0].pageX;
target.y = event.touches[0].pageY;
}
}
function keyup(event) {
switch (event.keyCode) {
case :
save();
break;
default:
// console.log(event.keyCode); hovertree.com
}
}
function letters(id) {
var el = document.getElementById(id),
letters = el.innerHTML.replace('&', '&').split(''),
heading = '';
for (var i = 0, n = letters.length, letter; i < n; i++) {
letter = letters[i].replace('&', '&');
heading += letter.trim() ? '<span class="letter-' + i + '">' + letter + '</span>' : ' ';
}
el.innerHTML = heading;
setTimeout(function () {
el.className = 'transition-in';
}, (Math.random() * ) + );
}
function save() {
if (!buffer) {
buffer = document.createElement('canvas');
buffer.width = screen.availWidth;
buffer.height = screen.availHeight;
buffer.ctx = buffer.getContext('2d');
form = document.createElement('form');
form.method = 'post';
form.input = document.createElement('input');
form.input.type = 'hidden';
form.input.name = 'data';
form.appendChild(form.input);
document.body.appendChild(form);
}
buffer.ctx.fillStyle = 'rgba(8,5,)';
buffer.ctx.fillRect(0, 0, buffer.width, buffer.height);
buffer.ctx.drawImage(canvas,
Math.round(buffer.width / 2 - canvas.width / 2),
Math.round(buffer.height / 2 - canvas.height / 2)
);
buffer.ctx.drawImage(logo,
Math.round(buffer.width / 2 - logo.width / 4),
Math.round(buffer.height / 2 - logo.height / 4),
logo.width / 2,
logo.height / 2
);
window.open(buffer.toDataURL(), 'wallpaper', 'top=0,left=0,width=' + buffer.width + ',height=' + buffer.height);
// form.input.value = buffer.toDataURL().substr();
// form.submit(); hovertree.com
}
window.requestAnimFrame = (function () {
return window.requestAnimationFrame || window.webkitRequestAnimationFrame || window.mozRequestAnimationFrame || function (fn) { window.setTimeout(fn, / ) };
})();
window.onload = function () {
ctx = document.getElementById('canvas').getContext('2d');
ctx.stats = new Stats();
ctx.running = true;
ctx.frame = 1;
logo = new Image();
logo.src = 'ht' + 'tp://ho' + 'vertree.c' + 'om/themes/hvtimages/hvtlogo.p' + 'ng';
hue = new Oscillator({
phase: Math.random() * Math.TWO_PI,
amplitude: ,
frequency: 0.,
offset:
});
letters('h1');
letters('h2');
document.addEventListener('mousemove', init);
document.addEventListener('touchstart', init);
document.body.addEventListener('orientationchange', resize);
window.addEventListener('resize', resize);
window.addEventListener('keyup', keyup);
window.addEventListener('focus', start);
window.addEventListener('blur', stop);
resize();
if (window.DEBUG) {
var gui = new dat.GUI();
// gui.add(settings, 'debug');
settings.gui.add(settings, 'trails', 1, ).onChange(reset);
settings.gui.add(settings, 'size', , ).onFinishChange(reset);
settings.gui.add(settings, 'friction', 0., 0.).onFinishChange(reset);
settings.gui.add(settings, 'dampening', 0., 0.4).onFinishChange(reset);
settings.gui.add(settings, 'tension', 0., 0.).onFinishChange(reset);
document.body.appendChild(ctx.stats.domElement);
}
};
})(window);
</script>
</body>
</html>
Seurat 4 源码解析 8: step4 QC可视化 VlnPlot()
本文旨在深入解析Seurat 4.1.0版本中用于质量控制和可视化的VlnPlot()函数,为不同层次的用户提供全面理解。VlnPlot()函数是Seurat分析流程中的关键组成部分,帮助用户以可视化形式评估数据质量,从而为后续分析提供可靠依据。下面,我们将逐步解析该函数的实现原理及用途。
VlnPlot()函数的实现基于R语言,位于seurat-4.1.0/R/visualization.R:文件中。其核心逻辑简洁而高效,通过一个if语句判断新版本的split.by功能是否发生变化,根据实际情况返回ExIPlot()函数。这个函数不仅揭示了Seurat包在设计时注重用户友好性和错误提示的特性,也展现了其内部结构的复杂性。
ExIPlot()函数则在文件中占据更多空间,定义在seurat-4.1.0/R/visualization.R:。它主要调用了SingleExIPlot()函数,通过这个函数进一步细化表达与身份的可视化。SingleExIPlot()函数在代码的最后十几行中首次调用ggplot2库,展示数据可视化的过程。
在解析过程中,我们还探讨了与VlnPlot()函数相关的其他函数,如DefaultAssay<-()、AutoPointSize()、InvertHex()、interaction()等,它们在数据处理、颜色生成、颜色反转、交互作用计算等不同环节发挥着关键作用。其中,AutoPointSize()函数用于自动调整散点图中点的大小,InvertHex()则提供了一种将颜色从进制转换为互补色的方法,进一步丰富了数据可视化的表现形式。
本文还提到了一些R语言技巧,如如何控制函数参数改变时的提示显示次数、合理设置图形列数、自动获取差异尽可能大的颜色以及如何使用Scales库中的hue_pal()函数等。这些技巧对于提升R语言编程效率和数据可视化质量具有重要意义。
总结而言,VlnPlot()函数是Seurat包中用于质量控制和可视化的强大工具,通过其内部实现逻辑和与之相关的辅助函数,为用户提供了一种高效、直观的方法来评估和理解单细胞转录组数据的质量。通过深入解析这些函数的实现细节,用户不仅可以更好地利用Seurat包进行数据分析,还能进一步提升数据可视化能力,为科学研究提供有力支持。
2024-11-30 00:08
2024-11-30 00:07
2024-11-29 23:47
2024-11-29 23:25
2024-11-29 23:20
2024-11-29 23:05