性欧美4khdxxxx,无码国产精品一区二区免费虚拟vr

Kafka常见面试�?PDF 下蝲

本站整理下蝲�Q?/strong>

链接�Q?a target="_blank">https://pan.baidu.com/s/1CFgBFY5WvAQ9s13odvfT_Q

提取码：pj1n

相关截图�Q?/strong>

主要内容�Q?/strong>

1、如何提升生产者的吞吐量？

1�Q�buffer.memory:讄��发送消息的�~�存区大��，默认值是32M。如果发送消息出�ȝ��速度��于写入消息�q�去的速度�Q�那么此时生产消息就会阻塞住�Q�所以这里就应该多做一些压力测试，��可能的保证�q�块�~�冲��Z��会被写满��D��生��消息被阻塞住�?/div>
2�Q�compression.type,默认值是none,不压�~�，但是也可以用lz4压羃�Q�效率还不错�Q�压�~�之后可以减��数据量�Q�提升吞吐量�Q�但是会加大producer端的cpu开销�?/div>
3�Q�batch.size�Q�设�|�batch的大��，如果batch太小�Q�会��D��频繁的网�l�请求，吞吐量下降，如果batch太大的话�Q�会��D��一条消息需要等待很久才能发送出去，而且会让内存�~�冲区有很大的压力，�q�多的数据缓冲在内存中，默认值是16K�Q�也��是说一个batch满了16K��׃��发送出去，一般在实际情况中，�q�个batch的值可以调大一些，以提升吞吐量�Q?/div>
4�Q�linger.ms �q�个默认值是0�Q�意思是消息必须立即发送出去，但这是不对的�Q�一般设�|?00ms左右�Q�也��是��_��q�个消息被发送出去，�q�入一个batch,如果�?00ms以内�Q�满�?6K的话�Q�自然会被发送出去，但到�?00ms,然而batch�q�没�?6K的话�Q�那么也必须把消息发送出去，不能让消息的发送�g�q�时间太长，也避免给内存造成�q�大的压力；

2、如何保证kafka内部数据不丢失？

从三个角度来回答�Q�producer,consumer,broker

1)producer

acks参数 1/0/-1

acks=0

生��者发送消息之后，不需要等待服务器响应�Q�他不管消息有没有成功发送出去，如果发送过�E�中遇到了异常，��D��broker端没有接收到消息�Q�消息也��׃��׃��Q�实际上�Q�他只是把消息发送到了socketBuffer�Q�缓存）中，而socketBuffer��Z��么没有被提交到broker他�ƈ不关心，他不能保证broker端是否接收到了消息，但是�q�样的配�|�对retry不�v作用�Q�因为producer端都不知道是否发生了错误�Q�而且对于offset的获取永�q�都�?1�Q�因为broker端可能还没写数据。这么不保险的操作�ؓ什么还会有�q�样的操作呢�Q�kafka对于攉��量数据�Q�如果在攉��某一��Ҏ(gu��)��志时是允许数据量有一定的丢失的话�Q�就可以用这��L��配置来收集日志�?/div>
acks=1(默认�?

生��者发送消息后�Q�只要分区的leader partition成功写入消息�Q�那么他��׃��收到来自服务端的成功响应�Q�其实就是消息只发给了leader partition�Q�leader partition收到消息后会�q�回ack到producer端，如果消息无法写入leader partition(选�D�Q�宕机等情况发生�?�Q�生产都会收��C��个错误的响应�Q��ؓ了避免丢失数据，producer可以选择重发消息�Q�如果消息成功写入，在被其他副本同步数据�Ӟ��此时恰好leader宕机�Q�副本无法同步到数据�Q�此时剩下的副本会选�D出新的leader partition�Q�但两个副本都没有刚刚写入的�q�条数据�Q�导致数据丢失；acks讄��?是消息可靠性和吞吐拉斯能够折中的方案�?/div>
acks=-1(或all)

生��者在发送消息之后，需要等待ISR中的所有副本都成功写入消息之后才能够收到来自服务器的响应，在配�|�环境相同的情况下，此种配置可以辑ֈ�最强的可靠性，需要follower都同步完数据�Q�也��是ISR队列中的所有broker全部保存完消息才会向ack发送消息，表示发送成功�?/div>
retry参数�Q?/div>
在kafka中，错误分�ؓ两种�Q�一�U�是可恢复的�Q�另一�U�是不可恢复的�?/div>
可恢复性的错误�Q?/div>
如果遇到在leader选�D、网�l�抖动等�q�些异常�Ӟ��如果我们�q�个时候配�|�的retries大于0�Q�也��是可以�q�行充实操作�Q�那么等到l(f��)eader选�D完，�|�络�E�_��后，�q�些异常��׃��消失�Q�错误也可以恢复�Q�数据再�ơ重发时��׃��正常发送到broker端，需要注意retries之间的时间间隔，以确保在充实时可恢复性错误都已经恢复�?/div>
不可恢复性错误：

如：��过了发送消息的最大�?max.request.size)�Ӟ��q�种错误是不可恢复的�Q�如果不做处理，那么数据��会丢失 �Q�因此我们需要注意在发生异常时把�q�些消息写入到DB、缓存到本地文�g中等�{�，把这些不成功的数据记录下来，�{�错误修复后�Q�再把这些数据发送到broker端�?/div>
配置�Ҏ(gu��)��Q?/div>
1.高可用型�Q?/div>
配置:acks=all,retries >0 retry.backoff.ms=100(�Ҏ(gu��)��实际情况讄��retry可能恢复的时间间�?

优点�Q�这样保证了producer端每发送一条消息都要成功，如果不成功将消息�~�存��h��Q�等异常恢复后再�ơ发送�?/div>
�~�点�Q�这样保证了高可用，但是会导致集��的吞吐量不是很高，因�ؓ数据发送到l(f��)eader之后�Q�leader要将数据同步到follower�Q�如果网�l�贷�ƾ不�E�_��Q�ack的响应时长会�ѝ�?/div>
2.折中型：

配置:acks=1 retyies>0 讄��retries旉��间隔

优点�Q�保证了消息的可靠性和吞吐量，是个折中的方�?/div>
�~�点�Q�性能介于两者之�?/div>
3.高吞吐量型：

配置�Q�acks=0

优点�Q�可以相对的容忍一些数据的丢失�Q�吞吐量大，可以接收大量��h��

�~�点�Q�不知道发送的消息是否成功

2�Q�Consumer

group.id:

consumer group分组的一个id,消费者隶属的消费�l�的名称�Q�在kafka中只允许消息只能被某个消费组中的一个消费者消费，如果为空�Q�则会报异常�Q�对于一个新的consumer加入到消�Ҏ(gu��)��Q�肯定会属于某个消费�l�，只有�q�样才能消费数据�?/div>
auto.offset.reset = earliest(最�?/latest�Q�最晚）

从何处开始进行消�?nbsp; 当一个新加入的consumer要进行消�Ҏ(gu��)��据，如果�q�个�q�个consumer是做数据分析工作的，是需要以前的历史数据�Q�那��׃��最早的位置消费数据�Q�如果仅仅是查看消费情况�Q�那可以从最晚位�|�开始消�Ҏ(gu��)��据�?/div>
enable.auto.commit =true/false�Q�默认是true�Q?/div>
是否开启自动提交偏�U�量的功能，默认是开启。当讄��为true�Ӟ��意味着由kafka的consumer端自己间隔一定时间会自动提交offset�Q�如果设�|�成了false�Q�也��是有客��L��(自己写代�?来提交，那就�q�得控制提交的时间间隔�?br />

亚洲精品92内射,午夜福利院在线观看免费 ,亚洲av中文无码乱人伦在线视色,亚洲国产欧美国产综合在线,亚洲国产精品综合久久2007

最新Java全栈��׃��实战评��(免费)

AI人工��学习大礼�?/h2>
IDEA�怹��Ȁ�z?/h2>

IDEA�怹��Ȁ�z?/h2>

66套java实战评��无套路领�?/h2>
锋哥开始收Java学员啦！

Python学习路线�?/h2>

锋哥开始收Java学员啦！

Python学习路线�?/h2>

Kafka常见面试�?PDF 下蝲

Java1234官方��?5�Q?/td>
Java1234官方��?5�Q?/td>	838462530