Go项目实战：打造高并发日志采集系统（六）

释放双眼，带上耳机，听听看~！

前情回顾

前文我们完成了日志采集系统的日志文件监控，配置文件热更新，协程异常检测和保活机制。

本节目标

本节加入kafka消息队列，kafka前文也介绍过了，可以对消息进行排队，解耦合和流量控制的作用，为什么一定要用kafka呢？主要原因就是在日志高并发读取后，如果直接将消息发给前端或者写入数据库，会造成崩溃或者卡死。kafka可以对消息进行排队和减轻压力，这样无论以后将这些消息录入数据库也好，传给前端分析也好，都能保证系统稳定性。代码我们也写过和测试了，只需要将之前写好的kafka读写消息代码整合过来即可。

主函数创建kafka生产者

在主函数中创建kafkaProducer,然后在defer中回收该资源。我们将该producer传递给每个监控日志的协程中，当日志有修改，就通过producer将修改的信息写入kafka，用kafka排队和缓存，可以提高稳定性，减少流量高峰。


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
1func main() {

2   //省略...

3   kafkaProducer := &amp;kafkaqueue.ProducerKaf{Producer: producer}

4   configMgr = make(map[string]*logconfig.ConfigData)

5   keyChan := make(chan string, KEYCHANSIZE)

6   ConstructMgr(configPaths, keyChan, kafkaProducer)

7   

8   defer func() {

9       mainOnce.Do(func() {

10            //省略...

11          kafkaProducer.Producer.Close()

12      })

13  }()

14

15  for {

16      select {

17      case pathData, ok := &lt;-pathChan:

18          if !ok {

19              return

20          }

21           //省略...

22          for conkey, conval := range pathDataNew {

23              oldval, ok := configMgr[conkey]

24              if !ok {

25                  //省略...

26                  go logtailf.WatchLogFile(configData.ConfigKey, configData.ConfigValue,

27                      ctx, keyChan, kafkaProducer)

28                  continue

29              }

30                

31                if oldval.ConfigValue != conval.(string) {

32                  //省略...

33                  go logtailf.WatchLogFile(conkey, conval.(string),

34                      ctx, keyChan, kafkaProducer)

35                  continue

36              }

37

38          }   

39        

40        case keystr := &lt;-keyChan:

41          val, ok := configMgr[keystr]

42          if !ok {

43              continue

44          }

45           //省略...

46          go logtailf.WatchLogFile(keystr, val.ConfigValue,

47              ctxcover, keyChan, kafkaProducer)

48      }

49  }

50}

51

52

WatchLogFile函数携带了该producer。有人会问多个协程共享producer是否会出问题？我查看了Producer发送消息的源码

红框中使用了chan传递数据，所以在多个协程调用producer的发送函数是没问题的。

监控协程写入kafka消息

当日志新增时，我们在监控日志的协程向kafka写入消息


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1func WatchLogFile(pathkey string, datapath string, ctx context.Context, keychan chan&lt;- string, kafProducer *kafkaqueue.ProducerKaf) {

2    //省略逻辑...

3    for true {

4       select {

5       case msg, ok := &lt;-tailFile.Lines:

6           //省略逻辑...

7           kafProducer.PutIntoKafka(pathkey, msg.Text)

8       case &lt;-ctx.Done():

9           fmt.Println(&quot;receive main gouroutine exit msg&quot;)

10          fmt.Println(&quot;watch log file &quot;, pathkey, &quot; goroutine exited&quot;)

11          return

12      }

13

14  }

15}

16

17

封装kafkaProducer

上述代码中调用的kafkaProducer是我自己封装的，其实就是组合了原生的kafka生产者，并且封装了发送函数


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
1func CreateKafkaProducer() (sarama.SyncProducer, error) {

2   config := sarama.NewConfig()

3

4   // 等待服务器所有副本都保存成功后的响应

5   config.Producer.RequiredAcks = sarama.WaitForAll

6   // 随机的分区类型：返回一个分区器，该分区器每次选择一个随机分区

7   config.Producer.Partitioner = sarama.NewRandomPartitioner

8   // 是否等待成功和失败后的响应

9   config.Producer.Return.Successes = true

10

11  // 使用给定代理地址和配置创建一个同步生产者

12  producer, err := sarama.NewSyncProducer([]string{&quot;localhost:9092&quot;}, config)

13  if err != nil {

14      fmt.Println(&quot;create producer failed, &quot;, err.Error())

15      return nil, err

16  }

17  fmt.Println(&quot;create kafka producer success&quot;)

18

19  return producer, nil

20}

21

22

上面的函数返回了原生的kafka生产者接口，接下来我们封装这个原生接口，然后编写了写入kafka的方法


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
1type ProducerKaf struct {

2   Producer sarama.SyncProducer

3}

4

5func (p *ProducerKaf) PutIntoKafka(keystr string, valstr string) {

6   //构建发送的消息，

7   msg := &amp;sarama.ProducerMessage{

8       Topic: &quot;logcatchsys&quot;,

9       Key:   sarama.StringEncoder(keystr),

10      Value: sarama.StringEncoder(valstr),

11  }

12  partition, offset, err := p.Producer.SendMessage(msg)

13

14  if err != nil {

15      fmt.Println(&quot;Send message Fail&quot;)

16      fmt.Println(err.Error())

17  }

18  fmt.Printf(&quot;Partition = %d, offset=%d, msgvalue=%s \n&quot;, partition, offset, valstr)

19

20}

21

22

启动kafka测试

我们先启动zookeeper和kafka
zookeeper进入bin文件夹点击zkServer.cmd即可启动
kafka启动使用如下命令


1
2
3
1.\bin\windows\kafka-server-start.bat .\config\server.properties

2

3

然后我们创建主题logcatchsys


1
2
3
1.\bin\windows\kafka-topics.bat --create --zookeeper localhost:2181 --replication-factor 1 --partitions 16 --topic logcatchsys

2

3

这样我们为主题logcatchsys创建了16个分区。
接下来我们启动消费者


1
2
3
1.\bin\windows\kafka-console-consumer.bat --bootstrap-server localhost:9092 --topic logcatchsys --from-beginning

2

3

然后我们启动我们的采集系统和测死脚本，看到如下

可以看到当日志文件不断被写入时，我们的采集系统会将修改的内容实时监控并写入kafka队列，然后kafka消费者从队列中取出这些消息。

总结

Go项目实战：打造高并发日志采集系统（六）

{{userData.name}}已认证

Go项目实战：打造高并发日志采集系统（六）

前情回顾

本节目标

主函数创建kafka生产者

监控协程写入kafka消息

封装kafkaProducer

启动kafka测试

总结

如何避免Adsense违规封号

安全咨询服务

{{userData.name}}已认证

前情回顾

本节目标

主函数创建kafka生产者

监控协程写入kafka消息

封装kafkaProducer

启动kafka测试

总结

Related posts:

如何避免Adsense违规封号

安全咨询服务

搭建一个高可用负载均衡的集群架构（四）

搭建一个高可用负载均衡的集群架构（一）

负载均衡器技术Nginx和F5的优缺点对比

缓存穿透，缓存击穿，缓存雪崩解决方案分析