在storm实时处理中,出现并发spout处理数据不平均的情况,看上去像是数据倾斜了,但实际上是flume写入多分区kafka时数据没有均发。
发现问题:
1、从storm UI Spout Executors中处理的数据量情况判断;
2、查看kafka topic对应的分区目录,所占磁盘大小判断。
解决办法:
给flume配置一个UUID Interceptor即可,配置如下:
#interceptor a1.sources.r1.interceptors = i2 a1.sources.r1.interceptors.i2.type = org.apache.flume.sink.solr.morphline.UUIDInterceptor$Builder a1.sources.r1.interceptors.i2.headerName = key a1.sources.r1.interceptors.i2.preserveExisting = false
注:a1是你配置flume进程名称,r1是flume sources的名称。
参考文章:http://www.jianshu.com/p/6ca0e308b139
标签: storm kafka partition flume 倾斜
分享:
崇尚极简,热爱技术,喜欢唱歌,热衷旅行,爱好电子产品的一介码农。
联系QQ:58742094
联系电话:
工作邮箱:
当你的才华还撑不起你的野心的时候,你就应该静下心来学习,永不止步!
人生之旅历途甚长,所争决不在一年半月,万不可因此着急失望,招精神之萎葸。
Copyright 2015- 芒果酷(mangocool.com) All rights reserved. 湘ICP备14019394号
免责声明:本网站部分文章转载其他媒体,意在为公众提供免费服务。如有信息侵犯了您的权益,可与本网站联系,本网站将尽快予以撤除。