一、采集日志到控制台输出

1. 首先,我们需要使用 netcat 工具,它是一款网络工具,可以用来检查网络连接,也可以用来从指定的网络端口上采集日志。

2. 其次,我们需要设置 netcat 的监听端口,使用以下命令:

nc -l -p 端口号
Bash
端口号可以根据实际情况自行设置。

3. 接下来,我们就可以在控制台看到采集到的日志信息了,可以使用以下命令:

nc -l -p 端口号 | tee 日志文件
Bash
这样,我们就可以把采集到的日志信息输出到控制台和日志文件中。

二、采集日志到 HDFS

1. 首先,我们需要使用 Flume 工具,它是一款分布式日志采集工具,可以用来从指定的网络端口上采集日志到 HDFS 中。

2. 其次,我们需要安装 Flume,并配置 Flume 的网络源,使用以下命令:

flume-ng agent --name a1 --conf conf --conf-file flume.conf --autostart
Bash
其中,flume.conf 文件中需要配置网络源,指定监听的端口号。

3. 最后,我们可以使用以下命令启动 Flume:

flume-ng agent --name a1 --conf conf --conf-file flume.conf --autostart
Bash
这样,我们就可以把采集到的日志信息输出到 HDFS 中了。