更新时间:2022-11-16 来源:黑马程序员 浏览量:
在类CategoryTopl0中定义main()方法,该方法是Java程序执行的入口,在main()方法中实现Spark程序,具体代码如文件1所示。
文件1 CategoryTop10.java
public class CategoryTop10{
public static void main(String[] arg){
//实现热门品类Top10分析
}
}
在文件1的main()方法中,创建JavaSparkContext和SparkConf对象.JavaSparkContext对象用于实现Spark
程序,SparkConf对象用于配置 Spark程序相关参数,具体代码如下。SparkConf conf =new SparkConf():
//设置Application 名称为topl0_category
conf.setAppName("top10_category"):
JavaSparkContext sc =new JavaSparkContext (conf);
在文件1的main()方法中,调用JavaSparkContext对象的textFile()方法读取外部文件,将文件中的数据加载到textFileRDD,具体代码如下。JavaRDD<String> textFileRDD =sc.textFile (arg [0]);
上述代码中,通过变量arg[o]指定文件路径,目的是执行提交Spark程序到YARN集群运行的命令中,通过参数指定文件路径。