建站之星导出网站,电子商务网站建设案例教程,企业网站模板整套,前端学多久可以找到工作SparkStreaming入门案例 一、准备工作 二、任务分析 三、官网案例 四、开发NetWordCount 一、准备工作 实验环境#xff1a;netcat 安装nc#xff1a;yum install -y nc 二、任务分析 将nc作为服务器端#xff0c;用户产生数据#xff1b;启动sparkstreaming案例中的客户端… SparkStreaming入门案例 一、准备工作 二、任务分析 三、官网案例 四、开发NetWordCount 一、准备工作 实验环境netcat 安装ncyum install -y nc 二、任务分析 将nc作为服务器端用户产生数据启动sparkstreaming案例中的客户端程序监听服务器端发送过来的数据并对其数据进行词频统计即为流式的wordcount入门程序 三、官网案例 启动nc作为服务器端执行nc -l 1234并输入测试数据如图所示 启动客户端执行 bin/run-example streaming.NetworkWordCount localhost 1234 注意如果要执行本例必须确保机器 cpu 核数大于 2 四、开发NetWordCount 创建maven工程 添加maven依赖即在pom.xml中添加streamming的依赖如下如果之前实验已经添加就不用再添加如果之前未添加则需要添加该依赖
dependency
groupIdorg.apache.spark/groupId
artifactIdspark-streaming_2.12/artifactId
version2.1.1/version
/dependency 3.开发NetWordCount程序
import org.apache.spark.SparkConf
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}
import org.apache.spark.streaming.{Seconds, StreamingContext}object StreamingTest {
def main(args: Array[String]): Unit {
val sparkConf newSparkConf().setMaster(local[2]).setAppName(StreamingTest)
val streamingContext new StreamingContext(sparkConf, Seconds(5))// 创建DStream对象并链接到nc服务器端
val ris: ReceiverInputDStream[String] streamingContext.socketTextStream(192.168.245.110, 1234,StorageLevel.MEMORY_AND_DISK)
// 采集数据并处理数据
val ds: DStream[String] ris.flatMap(_.split( ))
println(ris)
// 统计单词
val resultDS: DStream[(String, Int)] ds.map(x (x, 1)).reduceByKey(_ _)
// 打印结果
resultDS.print()
// 启动实时计算
streamingContext.start()
// 等待计算结束
streamingContext.awaitTermination()
}
} 4.先在虚拟机上启动nc服务器nc -l 1234并输入测试数据如图 5.然后运行程序 6.运行结果如下 参考 https://www.shuzhiduo.com/A/gVdneZLa5W/