news 2026/5/13 12:04:48

Dataflow优化(一)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Dataflow优化(一)

一、函数无优化

void top(a,b,c,d){
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代码在没有任何优化的时候,top的三个子函数是串行顺序的执行的。

二、对函数进行pipeline优化

void top(a,b,c,d){
#pragram pipeline ii =1
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代码对函数使用了pipeline优化后

func-a,func-b,func-c这三个函数函数顺序执行的,但是后和完全没有优化有差异,就是第二轮的func-a不需要等待func-c执行了才执行,而是,在func-a第一轮完成后,立马就开始第二轮func-a了。

三、对函数进行dataflow优化

void top(a,b,c,d){
#pragram dataflow
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代代码进行了dataflow优化

进行了dataflow优化后,可以看出func-a,func-b,func-c不在串行执行了,而是并行的,只要func-a提供了有效数据给到func-b了,func-b就开始执行了,func-c只要收到了func-b的输出有效数据,就开始执行了。

四、推荐看博客

https://blog.csdn.net/kanhao100/article/details/146267921?spm=1001.2101.3001.6650.5&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogOpenSearchComplete%7ERate-5-146267921-blog-156366068.235%5Ev43%5Epc_blog_bottom_relevance_base4&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogOpenSearchComplete%7ERate-5-146267921-blog-156366068.235%5Ev43%5Epc_blog_bottom_relevance_base4&utm_relevant_index=5

这篇博客的dataflow优化写的不错,可以看看。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 15:58:08

YOLO训练学习率设置不当?GPU利用率会明显下降

YOLO训练学习率设置不当?GPU利用率会明显下降 在部署YOLO模型进行目标检测训练时,不少工程师都遇到过这样的困扰:明明配备了高端GPU,监控工具却显示利用率长期徘徊在30%~50%,甚至出现锯齿状剧烈波动。直觉上我们会怀疑…

作者头像 李华
网站建设 2026/5/5 4:31:31

火炼人心,执破新生——写给困在集体执念里的觉醒者

我们总说人间是灵魂的炼狱,却忘了炼狱的熔炉,从来都是人类自己亲手点燃的。这份煎熬,源于我们把意识的全息自由度,死死坍缩在了“低维执念”的硬壳里。个人困在“必须成功、必须合群”的认知囚笼中撞得头破血流;人类集…

作者头像 李华
网站建设 2026/5/8 16:09:00

ARM架构抗干扰设计在恶劣环境中的表现:系统讲解

恶劣环境下的“硬核”守护者:ARM架构如何扛住高温、强干扰与长期运行?在一座现代化的智能工厂里,PLC控制器正默默监控着整条产线。车间温度高达70C,变频器频繁启停带来剧烈的电磁脉冲,振动与粉尘无处不在。然而&#x…

作者头像 李华
网站建设 2026/5/8 7:55:43

大数据领域数据服务的隐私保护措施

大数据时代的数据隐私保卫战:从“裸奔”到“铠甲”的进化之路 关键词 大数据隐私保护、差分隐私、联邦学习、数据脱敏、隐私计算、合规性、用户授权 摘要 在大数据成为“数字石油”的时代,数据服务的价值与隐私泄露的风险如同硬币的两面。当我们享受个性…

作者头像 李华
网站建设 2026/5/11 20:49:13

YOLO推理服务弹性伸缩:根据GPU负载自动扩缩容

YOLO推理服务弹性伸缩:根据GPU负载自动扩缩容 在智能制造、智慧交通和城市安防等高并发AI场景中,实时视频流的目标检测任务正变得越来越普遍。一个典型的工厂质检系统可能需要同时处理数十路高清摄像头输入,而夜间或非生产时段流量却骤降为个…

作者头像 李华