Storm的基本概念

Storm是一个开源的分布式实时计算系统,最初由Nathan Marz于2011年创建。它可以在大规模集群上运行,处理实时数据流,支持高吞吐量和低延迟的数据处理。Storm提供了一个可扩展的、容错的、高可用的平台,可以处理海量数据源,包括实时日志、传感器数据、交易数据等等。

Storm采用了一种分布式架构,将数据分成多个流,每个流由一个或多个任务处理。每个任务都有自己的线程,可以并行处理流中的数据。Storm还提供了可靠性保证,如果一个任务失败,它会自动重启并重新处理数据。

Storm的核心概念包括Spout(数据源)、Bolt(数据处理)和Topology(拓扑结构)。Spout从数据源获取数据,并将其发送到Bolt中进行处理。Bolt可以执行各种数据处理操作,例如过滤、聚合、计数等。Topology是一个由Spout和Bolt组成的有向图,描述了数据流的流向和处理逻辑。

其中

  1. Topology(拓扑结构): Topology是Storm中描述实时数据流处理逻辑的概念,它由Spouts和Bolts组成的有向图。Topology定义了数据流的流向和处理逻辑,描述了数据如何从数据源经过各种处理操作最终输出到目标。

  2. Streams(数据流): Streams是指在Topology中流动的数据,它代表了数据的实时流动。数据可以通过不同的Stream进行分发、过滤、聚合等处理操作,最终被传递到目标Bolts进行处理。

  3. Spouts(数据源): Spouts是Topology中的组件,用于从外部数据源获取数据并将其发送到Topology中进行处理。Spouts可以是从消息队列、数据库、文件系统等数据源中获取数据,并将数据发送到Topology中。

  4. Bolts(数据处理): Bolts是Topology中的组件,用于对数据进行各种处理操作。Bolts可以执行过滤、聚合、计数、连接等数据处理操作,对数据进行实时处理和转换。Bolts接收来自Spouts或其他Bolts的数据流,并将处理后的数据发送到下游的Bolts或目标系统中。

Storm还提供了一些扩展功能,例如分组、流分区、可靠性保证、事务性处理等。它还可以与其他大数据平台集成,例如Hadoop、HBase、Kafka等。

总的来说,Storm是一个快速、可靠、可扩展的实时计算系统,可以帮助企业处理大规模的实时数据流,支持多种数据处理操作和扩展功能。

并行度

Storm的并行度是指在处理数据流时同时执行任务的数量。在Storm中,数据流可以被分成多个流,每个流由一个或多个任务处理。这些任务可以并行执行,以加快数据处理速度和提高系统的吞吐量。

并行度可以在Spouts和Bolts上进行配置。在Spouts中,可以配置并行度来决定从数据源获取数据的速度和并行处理的数量。在Bolts中,可以配置并行度来决定数据处理任务的数量,从而实现对数据流的并行处理。

通过配置并行度,可以根据系统的需求来调整处理数据的速度和规模。较高的并行度可以提高系统的处理速度和吞吐量,但也需要更多的计算资源。而较低的并行度则可以减少资源消耗,但可能会影响系统的处理性能。

1 个 Worker 进程执行的是 1 个 Topology 的子集,不会出现 1 个 Worker 为多个 Topology 服务的情况,因此 1 个运行中的 Topology 就是由集群中多台物理机上的多个 Worker 进程组成的。1 个 Worker 进程会启动 1 个或多个 Executor 线程来执行 1 个 Topology 的 Component(组件,即 Spout 或 Bolt)。 Executor 是 1 个被 Worker 进程启动的单独线程。每个 Executor 会运行 1 个 Component 中的一个或者多个 Task。 Task 是组成 Component 的代码单元。Topology 启动后,1 个 Component 的 Task 数目是固定不变的,但该 Component 使用的 Executor 线程数可以动态调整(例如:1 个 Executor 线程可以执行该 Component 的 1 个或多个 Task 实例)。这意味着,对于 1 个 Component 来说,#threads<=#tasks(线程数小于等于 Task 数目)这样的情况是存在的。默认情况下 Task 的数目等于 Executor 线程数,即 1 个 Executor 线程只运行 1 个 Task。

莫德丽莎
关注 关注
  • 28
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Storm基本概念
LC900730的博客
12-06 383
Spout是计算流的来源。通常在系统中spout从Kestrel、RabbitMQ和kafka等消息队列读取,但是spout还可以生成自己的流或者从某个API读取。 Bolt处理任意数量的输入流,并且产生任意数量的新的输出流。大多数的逻辑计算进入bolt,如功能、过滤、流连接与数据库交互等。 Topology是一个由很多Spout和Bolt构成的网络,网络上每条边代表了一个Bolt订阅的数据流,
Storm 基本概念
gonghaiyu的博客
11-19 336
概念 Storm 是一个免费并开源的分布式实时计算系统。利用Storm 可以很容易做到可靠地处理无限的数据流,像Hadoop 批量处理大数据一样,Storm 可以实时处理数据。 集群架构 Nimbus(master-代码分发给supervisor) Storm 集群的Master 节点,负责分发用户代码,指派给具体的Supervisor 节点上的Worker 节点,去运行Topology 对应的组件(Spout/Bolt)的Task。 Supervisor(slave-管理worker进程的启动和终止)
storm基本概念小结
fu_jiannan的博客
06-15 477
storm框架概念 一、storm基本概念       storm是一个开源的分布式实时数据计算系统,Storm可以用来处理源源不断流进来的消息,处理之后将结果写入到某个存储中去。hadoop本质上是一个批处理系统,其缺陷在于不能实时地处理数据,而storm的实时处理数据的能力有效地解决了hadoop的瓶颈。 二、storm架构与hadoop架构的对比
storm基本概念
cjf_wei的博客
05-07 609
Storm是一个免费的开源的分布式实时计算平台,基于Storm的有向无环拓扑可以轻松的处理数据流。本文介绍storm的一些基本概念
Storm基本概念理解
网世的博客
07-30 381
一 基本组件介绍 核心组件图解 Nimbus :Storm集群的Master节点,负责分发用户代码,指派给具体的Supervisor节点上的Worker节点,去运行Topology对应的组件(Spout/Bolt)的Task。 Supervisor :Storm集群的从节点,负责管理运行在Supervisor节点上的每一个Worker进程的启动和终止。通过Storm的配置文件...
storm基本概念和使用
weixin_42739473的博客
01-17 373
1.storm是什么 strom是apache下的一个顶级的项目,官网地址为http://storm.apache.org/ 借用官网的一段话 Apache Storm is a free and open source distributed realtime computation system 是一个免费开源的分布式实时计算系统 2.strom的特点是什么和应用场景举例 特点:实...
Storm 核心概念详解
mxk4869的博客
07-19 742
Storm 核心概念详解
storm笔记:storm基本概念
沉潜飞动
01-21 5632
本文主要介绍storm中的基本概念,从基础上了解strom的体系结构,便于后续编程过程中作为基础指导。主要的概念包括:topology(拓扑)、stream(数据流)、spout(水龙头、数据源)、bolt(螺栓,数据筛选处理)、stream group(数据流分组)、reliability(可靠性)、task(任务)、worker(执行者)
storm基本概念
chenyang2015的博客
05-06 180
storm基本概念 1.storm vs mapReduce对比,storm面向实时处理。mapReduce面向批量 mapReduce 优点:稳定、吞吐能力强。缺点:时效性差。特点:批处理,hadoop任务执行结束。 storm优点:时效性强,毫秒级别。缺点:吞吐差。特点:增量式处理,strom任务没有结束。 2.storm没有持久化层,本地模式 3.storm基本概念: stream:数据...
java storm demo_1 storm基本概念 + storm编程规范及demo编写
weixin_30563489的博客
02-16 740
本博文的主要内容有.Storm的单机模式安装.Storm的分布式安装(3节点).No space left on device.storm工程的eclipse的java编写分布式的一个计算系统,但是跟mr不一样,就是实时的,实时的跟Mr离线批处理不一样。离线mr主要是做数据挖掘、数据分析、数据统计和br分析。Storm,主要是在线的业务系统。数据像水一样,源源不断的来,然后,在流动的过程中啊,就要...
实时计算:Apache Storm:ApacheStorm基本概念与术语.docx
09-02
实时计算:Apache Storm:ApacheStorm基本概念与术语.docx
Twitter storm
09-22
#### Storm 基本概念 - **Topology**:Storm应用程序的基本单位。一个Topology定义了一个完整的计算流程,包括数据源(spout)、处理逻辑(bolt)以及它们之间的连接方式。Topology一旦提交至集群,就会一直运行,...
Storm API实现词频统计
05-30
首先,我们需要理解Storm的基本架构。Storm由多个组件构成,包括Spout(数据源)、Bolt(数据处理逻辑)以及Topology(拓扑结构)。在这个词频统计案例中,Spout可能是我们自定义的Java程序,用于生成随机或特定的...
apache-storm-2.4.0.tar.gz
06-20
安装 Apache Storm 的基本步骤通常包括: 1. 下载 `apache-storm-2.4.0.tar.gz` 并解压到一个适当的目录。 2. 修改 `conf/storm.yaml` 配置文件,根据实际情况设置 ZooKeeper、nimbus、supervisor等节点的信息。 3. ...
2023牛客暑期多校训练营9 B.Semi-Puzzle: Brain Storm
PTCCTP的博客
08-15 1019
Tag:扩欧、数学
Python 如何调用讯飞星火大模型API
hello_1995的博客
09-21 713
讯飞星火是科大讯飞推出的一款先进的人工智能大模型,它具备强大的语言理解和知识问答能力,能够在多种场景中提供智能化服务。2024年6月27日,科大讯飞发布了讯飞星火大模型V4.0版本,全面对标GPT-4 Turbo。
elasticsearch学习与实战应用
最新发布
cesske的博客
09-22 533
Elasticsearch的学习与实战应用是一个涉及多个方面的过程,以下将从学习路径、核心概念、实战应用及优化策略等方面进行详细介绍。提示:以下是本篇文章正文内容,下面案例可供参考综上所述,Elasticsearch的学习与实战应用是一个系统而复杂的过程,需要不断学习和实践。通过掌握基础知识、进阶知识和实战操作技巧,并结合优化策略来提高性能和可靠性,可以充分发挥Elasticsearch在数据处理和搜索分析方面的优势。
Can‘t get Kerberos realm
bruce128的专栏
09-18 308
近期搞Ozone开发,需要走kerberos登陆,遇到了一个问题,花了很长时间解决。记录一下,跟网上能搜到的不大一样。
大数据技术原理与应用
m0_74161592的博客
09-20 670
1、大数据时代的特征,并结合生活实例谈谈带来的影响。(一)特征1、Volume 规模性:数据量大。2、Velocity高速性:处理速度快。数据的生成和响应快摩尔定律:每两年,数据量增加一倍1秒定律:响应时间时间控制在1秒以内3、Variety多样化:数据种类繁多。大数据是由结构化、非结构化、半结构化数据组成的,结构化数据仅占10%左右;非结构化数据,它们与人类信息密切相关;4、Value价值性:价值密度低。价值密度低,商业价值高;通过各类大量数据中挖掘有价值的信息;
Apache Storm核心概念与架构深度解析
流是Storm中的基本数据结构,代表了一组无序的、不断产生的元组。每个流都有一个唯一的ID,可以由Spout发出,也可以由Bolt处理后产生新的流。 ### 1.3 Spouts Spout是Storm数据流的源头,负责生成数据流。它们可以...
写文章

热门文章

  • 熵权法Matlab代码 1349
  • 云计算-Spark部分复习(自用) 1217
  • 相关系数Matlab代码 1171
  • 云计算-HIVE部分代码复习(自用) 1159
  • Storm的基本概念 1082

最新评论

  • 灰色关联分析

    CSDN-Ada助手: 恭喜您撰写了关于灰色关联分析的精彩博文!您对这一主题的深入探讨让我受益匪浅。在您的下一篇博文中,我期待您能够结合实际案例,进一步分析灰色关联分析在实际问题中的应用,这将会为读者提供更多实用的参考价值。希望您能够继续保持创作的热情,期待您更多的精彩内容!

  • 灰色关联分析Matlab代码

    CSDN-Ada助手: 恭喜您写了第17篇博客!看到您分享的灰色关联分析Matlab代码,我感到非常兴奋。您的文章内容清晰易懂,对Matlab代码的解析也非常详细,让我受益匪浅。 希望您能继续保持创作的热情,分享更多关于数据分析和编程的知识。或许下一步可以考虑分享一些实际案例或者应用场景,让读者更好地理解灰色关联分析的实际应用。期待您的下一篇作品,谢谢您的分享!

  • 模糊综合评价

    CSDN-Ada助手: 恭喜您撰写了第18篇博客“模糊综合评价”,内容深入浅出,让人受益匪浅。希望您能继续保持创作的热情,探索更多有关模糊综合评价的知识,并结合实际案例进行深入分析,为读者呈现更丰富的内容。期待您的下一篇作品,加油!

  • 灰色预测GM11模型

    CSDN-Ada助手: 恭喜作者成功写下第19篇博客,内容涉及灰色预测GM11模型,对于预测模型的研究有着重要的意义。希望作者能够继续坚持创作,不断深入探索预测模型的应用与发展。或许下一步可以考虑对比不同预测模型的优劣势,为读者提供更多实用的参考。期待作者的下一篇作品!

  • Docker Desktop基础概念与安装

    CSDN-Ada助手: 恭喜作者第20篇博客《Docker Desktop基础概念与安装》的成功发布!您的坚持与努力让我们得以学习到更多有关Docker Desktop的知识。希望您能继续分享更多关于Docker Desktop的进阶使用技巧,或者可以考虑分享一些实际案例或者问题解决经验,这样可以让读者更好地理解和运用这些知识。期待您的下一篇博客!

大家在看

  • Docker 付费订阅价格大幅上调,免费订阅功能受限,云计算和安全产品有调整
  • 基于springboot+vue的微信小程序的网上订餐服务管理系统的设计与实现
  • 第二章 网页制作排版习题 366
  • SpringBoot+Vue校园外卖小程序(源码获取在文末) 493
  • NLP大牛Thomas Wolf发布新书《Transformer自然语言处理》,全书466页pdf及代码

最新文章

  • 云计算-HIVE部分代码复习(自用)
  • 云计算-hadoop代码部分复习(自用)
  • 云计算-HDFS部分复习(自用)
2023年33篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家郑州玻璃钢不锈钢树叶雕塑定做梅州玻璃钢动物雕塑批量定制生产形象卡通游乐园玻璃钢雕塑深圳玻璃钢雕塑躺椅藤县玻璃钢雕塑公司铜玻璃钢雕塑图片南京人物玻璃钢雕塑定制松原玻璃钢雕塑多少钱玻璃钢雕塑厂家厂上海通道商场美陈制造四川超市商场美陈销售企业附近的玻璃钢雕塑工艺工业玻璃钢雕塑摆件采购扬州商场新春美陈城市玻璃钢雕塑制作嘉兴玻璃钢卡通雕塑厂家公园摆件玻璃钢雕塑批量定制广西玻璃钢仿铜雕塑定制重庆玻璃钢仿铜雕塑乐园玻璃钢雕塑定制厂家玻璃钢雕塑 泡沫河北玻璃钢雕塑怎么翻新重庆水果玻璃钢雕塑生产厂家常见玻璃钢花盆批发台湾玻璃钢雕塑厂家室内玻璃钢景观雕塑定制建材商场美陈图片兰州玻璃钢景观雕塑定制德兴玻璃钢关公雕塑玻璃钢吉祥物校园雕塑香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化