【eclipse类源码】【视频源码剪辑】【黑熊猫源码】spark 源码 sbt-皮皮网

【eclipse类源码】【视频源码剪辑】【黑熊猫源码】spark 源码 sbt

时间:2024-11-30 20:47:34 来源：活字格源码编辑：chrome源码公开吗

1.å¦ä½è¿è¡Sparkç¨åº
2.åºäºSparkçDruid ç´¢å¼ä»»å¡ï¼druid-spark-batchï¼
3.如何在Mac使用Intellij idea搭建远程Hadoop开发环境

spark 源码 sbt

å¦ä½è¿è¡Sparkç¨åº

ãã2ãå°ç¸åºç®å½ä¸ç¼åç¨åºï¼sparkç¨åºå¿é¡»è¦åå»ºä¸ä¸ªSparkContextå®ä¾ãSparkContext("master", "projectName", "SPARK_HOME", "yourProject.jar path")

ãã3ãsbt compileå½ä»¤ç¼è¯ç¨åºæ éåï¼sbt packageå½ä»¤å°ç¨åºæåãé»è®¤æåçjaræä»¶åæ¾è·¯å¾ä¸ºï¼é¡¹ç®æ ¹ç®å½/target/scala-xx.xx.xx/your-project-name_xx.xx.xx-xx.jar

ãã4ãå°æåå¥½çjaré®ä»·æ·»å å°SPAK_CLASSPATHä¸ï¼å¨linuxä¸æ ¹æ®ä½ç¨èå´çä¸åæå¤ç§æ´æ¹ç¯å¢åéçæ¹å¼ï¼è¿éåªè¯´æçéç½®æ¹å¼ï¼sparkæ ¹ç®å½ä¸çconf/spark-env.shæä»¶æ·»å SPARK_CLASSPATH:xxxxxxxxï¼

ãã5ãéç½®å¥½ç¯å¢åéåå°±å¯ä»¥å¨sparkçæ ¹ç®å½ä¸ä½¿ç¨./runèæ¬è¿è¡ä½ çç¨åºäºä¾å¦ï¼./run spark.examples.SparkPi spark://masterIP:portæ³¨æï¼å¦æç¨åºæ¶åIOæä½èµ·é»è®¤è·¯å¾ä¸ºSPARK_HOMEï¼è³äºå¦ä½ä¿®æ¹è¿ä¸ªè·¯å¾ï¼æå¾ç ç©¶

è½¬è½½ï¼ä»ä¾åèã

åºäºSparkçDruid ç´¢å¼ä»»å¡ï¼druid-spark-batchï¼

éçDruidä¸çDataSourceçæ°éåæ°æ®éå¢å ï¼ä½¿ç¨åæ¥ç Hadoop MRç´¢å¼ä»»å¡å·²ç»ä¸è½æ»¡è¶³å¯¹å¤§æ°æ®éåå¥Druidçéæ±ï¼æ¥éæ¾å°æ´å¿«çåå¥æ¹å¼ãå°±æ¯æ¬æä»ç»ç druid-spark-batch

githubå°å

Spark is included in the default hadoop coordinates similar to druid.indexer.task.defaultHadoopCoordinates=["org.apache.spark:spark-core_2.:1.5.2-mmx1"]

1.5.2-mmx1 æ¯ä¾èµçsparkçæ¬å·ï¼æ¬ä¾ä½¿ç¨çæ¯spark-2.2.0ï¼ æä»¥middleManagerèç¹çéç½®å¦ä¸ï¼

åæ¶æä¾èµçspark2.2.0çåæ·è´å° druid-install-path/hadoop-dependencies/spark-core_2./2.2.0 ç®å½ä¸

Druid 0..0 jacksonçæ¬ä¸º2.4.6ï¼ Druid-spark-batch jacksonçæ¬ä¸º2.6.5ã

ä¿®æ¹Druid 0..0 jacksonçæ¬ä¸º2.6.5ï¼éæ°ç¼è¯ï¼è§£å³è¯¥é®é¢ã

guice å guavaåå²çªï¼druid-spark-batch æ¯ç¨çæ¯guice-4.1.0.jar å guava-.0.1.jarã

properties è®¾ç½® spark.executor.extraClassPath=trueï¼ å¹¶éç½® spark.executor.extraLibraryPathï¼ å¦ä¸ï¼

druid hdfs-storage extension æ¨¡åçHadoopFsWrapper.rename è°ç¨äº HadoopçFileSystemç±»ä¸çRenameæ¹æ³ã

è§£å³æ¹æ³ï¼ **ä¿®æ¹HadoopFsWrapperç§çrenameæ¹æ³ï¼ä¿®æ¹æfs.rename(from, to)

src/main/scala/io/druid/indexer/spark/SparkDruidIndexer.scala

ä¿®æ¹å¦ä¸ï¼

如何在Mac使用Intellij idea搭建远程Hadoop开发环境

（1）准备工作

1）

安装JDK

6或者JDK

2）

安装scala

2..x

(注意版本)

2）下载Intellij

IDEA最新版（本文以IntelliJ

IDEA

Community

Edition

.1.1为例说明，不同版本，界面布局可能不同）

3）将下载的Intellij

IDEA解压后，安装scala插件，eclipse类源码流程如下：

依次选择“Configure”–>

“Plugins”–>

“Browse

repositories”，输入scala，然后安装即可

（2）搭建Spark源码阅读环境（需要联网）

一种方法是直接依次选择“import

project”–>

选择spark所在目录

–>

“SBT”，之后intellij会自动识别SBT文件，并下载依赖的外部jar包，整个流程用时非常长，取决于机器的视频源码剪辑网络环境（不建议在windows

下操作，可能遇到各种问题），一般需花费几十分钟到几个小时。注意，下载过程会用到git，因此应该事先安装了git。黑熊猫源码

第二种方法是首先在linux操作系统上生成intellij项目文件，然后在intellij

IDEA中直接通过“Open

Project”打开项目即可。在linux上生成intellij项目文件的方法（需要安装git，不需要安装scala，sbt会自动下载）是通讯工具源码：在

spark源代码根目录下，输入sbt/sbt

gen-idea

注：如果你在windows下阅读源代码，建议先在linux下生成项目文件，然后导入到windows中的intellij

IDEA中。

（3）搭建Spark开发环境

在intellij

IDEA中创建scala

project，并依次选择“File”–>

“project

structure”

–>

“Libraries”，每日答题源码选择“+”，将spark-hadoop

对应的包导入，比如导入spark-assembly_2.-0.9.0-incubating-hadoop2.2.0.jar（只需导入该jar

包，其他不需要），如果IDE没有识别scala

库，则需要以同样方式将scala库导入。之后开发scala程序即可：

编写完scala程序后，可以直接在intellij中，以local模式运行，方法如下：

点击“Run”–>

“Run

Configurations”，在弹出的框中对应栏中填写“local”，表示将该参数传递给main函数，如下图所示，之后点击“Run”–>

“Run”运行程序即可。

如果想把程序打成jar包，通过命令行的形式运行在spark

集群中，可以按照以下步骤操作：

依次选择“File”–>

“Project

Structure”

–>

“Artifact”，选择“+”–>

“Jar”

–>

“From

Modules

with

dependencies”，选择main函数，并在弹出框中选择输出jar位置，并选择“OK”。

最后依次选择“Build”–>

“Build

Artifact”编译生成jar包。

关注更多相关资讯请点击《焦点》专栏

上一条：easyui 源码 1.3.3
下一条：翰墨拍卖源码_翰墨拍卖源码是什么

【eclipse类源码】【视频源码剪辑】【黑熊猫源码】spark 源码 sbt

相关文章