一、采集日志到控制台输出

1. 首先,我们需要使用netcat工具,它是一款网络工具,可以用来检查网络连接,也可以用来从指定的网络端口上采集日志。

2. 其次,我们需要设置netcat的监听端口,使用以下命令:

端口号可以根据实际情况自行设置。

3. 接下来,我们就可以在控制台看到采集到的日志信息了,可以使用以下命令:

这样,我们就可以把采集到的日志信息输出到控制台和日志文件中。

二、采集日志到HDFS

1. 首先,我们需要使用Flume工具,它是一款分布式日志采集工具,可以用来从指定的网络端口上采集日志到HDFS中。

2. 其次,我们需要安装Flume,并配置Flume的网络源,使用以下命令:

其中,flume.conf文件中需要配置网络源,指定监听的端口号。

3. 最后,我们可以使用以下命令启动Flume:

这样,我们就可以把采集到的日志信息输出到HDFS中了。