【发布时间】:2015-01-24 08:56:31
【问题描述】:
有什么方法可以防止camus 增加偏移值,让它一直读取之前的值?
以及如何为创建的文件提供自定义名称而不是通用格式,即topic.leaderId.partitionId.partitioner.encodePartition(context, key)?
【问题讨论】:
标签: hadoop hdfs apache-kafka camus
有什么方法可以防止camus 增加偏移值,让它一直读取之前的值?
以及如何为创建的文件提供自定义名称而不是通用格式,即topic.leaderId.partitionId.partitioner.encodePartition(context, key)?
【问题讨论】:
标签: hadoop hdfs apache-kafka camus
映射器输出的文件名在com.linkedin.camus.etl.Patitioner 类的generateFileName 方法中生成。
你可以实现一个自定义的 Partitioner 并在 as 中提供一个逻辑
@Override
public String generateFileName(JobContext context, String topic, String brokerId, int partitionId, int count,
long offset, String encodedPartition) {
return "MyCustomFileName-"+topic+partitionId;
}
【讨论】: