题目
【单选题】每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:A. GraphX B. S4 C. Hive D. Impala
【单选题】每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:
A. GraphX
B. S4
C. Hive
D. Impala
A. GraphX
B. S4
C. Hive
D. Impala
题目解答
答案
S4
解析
流计算的核心是实时处理连续的数据流,强调低延迟和高吞吐量。本题需识别选项中专门针对流计算的产品。
- GraphX:图计算框架,用于静态图数据分析。
- S4:专为流计算设计,支持实时数据处理。
- Hive:批处理工具,基于Hadoop,适用于离线分析。
- Impala:实时SQL查询引擎,针对已存储数据快速分析。
关键点:明确区分流计算与批处理、图计算、实时查询的差异。
选项分析
A. GraphX
- 功能:Apache Spark的图计算组件,用于处理图结构数据(如社交网络)。
- 应用场景:图算法(如PageRank)、图模式匹配。
- 结论:与流计算无关,排除。
B. S4
- 功能:Scalable Streaming System,专为流计算设计。
- 特点:支持实时数据流的高吞吐量处理,提供流式计算模型。
- 结论:符合题意,为正确答案。
C. Hive
- 功能:基于Hadoop的批处理工具,通过HQL进行数据仓库管理。
- 特点:处理静态数据,延迟较高。
- 结论:属于批处理,排除。
D. Impala
- 功能:Hadoop上的实时SQL查询引擎,优化快速分析。
- 特点:针对已存储数据的交互式查询,非流式处理。
- 结论:属于快速查询工具,排除。