用DolphinScheduler轻松实现Flume数据采集任务自动化！

2024-04-24 17:59 由海豚调度发表于 #数据库

转载自天地风雷水火山泽

目的

因为我们的数仓数据源是Kafka，离线数仓需要用Flume采集Kafka中的数据到HDFS中。
在实际项目中，我们不可能一直在Xshell中启动Flume任务，一是因为项目的Flume任务很多，二是一旦Xshell页面关闭Flume任务就会停止，这样非常不方便，因此必须在后台启动Flume任务。
所以经过测试后，我发现海豚调度器也可以启动Flume任务。

海豚调度Flume任务配置

（一）Flume在Linux中的路径

（二）Flume任务文件在Linux中的位置以及任务文件名

（三）在海豚中配置运行脚本

#!/bin/bash
source /etc/profile

/usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties

注意：/usr/local/hurys/dc_env/flume/flume190/为Flume在Linux中的安装，根据自己安装路径进行调整
（四）海豚任务配置好后就可以启动海豚任务

（五）在HDFS对应文件夹中验证是否采集到数据

可以看到，Flume采集Kafka数据成功写入到HDFS中，成功实现用Apache DolphinScheduler执行Flume任务的目的！
原文链接：
https://blog.csdn.net/tiantang2renjian/article/details/136399112

本文由白鲸开源提供发布支持！

热门相关：明尊明天和意外龙皇武神豪门24小时：吻别霸道前夫剑道邪尊Ⅱ

指标+AI：迈向智能化，让指标应用更高效

近日，以“Data+AI，构建新质生产力”为主题的袋鼠云春季发布会圆满落幕，大会带来了一系列“+AI”的数字化产品与最新行业沉淀，旨在将数据与AI紧密结合，打破传统的生产力边界，赋能企业实现更高质量、更高效率的数字化发展。会上，袋鼠云业务总经理申杭带来了以“指标+AI：迈向智能化，让指标应用更高效” ...阅读全文

SQL Server实战一：创建、分离、附加、删除、备份数据库

本文介绍基于Microsoft SQL Server软件，实现数据库创建、分离、附加、删除与备份的方法。目录1 交互式创建数据库2 Transact-SQL指定参数创建数据库3 交互式分离数据库testbase14 使用系统存储过程分离数据库testbase25 数据库文件备份：分离数据库再复制其 ...阅读全文

GaussDB SQL查询语句执行过程解析

今天我们就从GaussDB SQL引擎入手，了解一下GaussDB SQL 查询语句的执行过程，包括GaussDB SQL引擎原理和关键技术点。 ...阅读全文

“企业创新新引擎”数据库专项赋能会，让云原生技术普惠千行百业！

由福州软件园科技创新发展公司和华为技术有限公司联合主办的HCDG城市行福州站——“企业创新新引擎”数据库专项赋能会在福州软件园成功举办。 ...阅读全文

GreatSQL统计信息相关知识点

相关知识点： INNODB_STATS_PERSIST=ON或用STATS_PERSIST=1定义单个表时，优化器统计信息将持久化到磁盘。默认情况下，innodb_stats_persistent是启用的。持久统计信息存储在mysql.innodb_table_stats和mysql.innodb ...阅读全文

手把手教你掌握SeaTunnel k8s运行Zeta引擎本地模式的技巧

转载自小虾米0.0 导读：随着Kubernetes的普及和发展，越来越多的企业和团队开始使用Kubernetes来管理和部署应用程序。然而，Kubernetes的默认工作方式可能不是最佳的选择，尤其是在需要更高效、更可靠的应用程序部署和管理能力时。因此，SeaTunnel提供了一种运行Zeta引擎( ...阅读全文

告别手动调度，海豚调度器 3.1.x 集群部署让你轻松管理多机！

转载自第一片心意 1 前言由于海豚调度器官网的集群部署文档写的较乱，安装过程中需要跳转到很多地方进行操作，所以自己总结了一篇可以直接跟着从头到尾进行操作的文档，以方便后续的部署、升级、新增节点、减少节点的相关操作。 2. 提前准备 2.1. 基础组件 JDK：下载JDK (1.8+)，安装并配置 ...阅读全文

cls_oracle_logs.sh脚本遭遇TNS-12508错误浅析

cls_oracle_logs.sh脚本的输出日志中有TNS-12508错误，具体如下所示 ........................................................................LSNRCTL> Current Listener is gsp ...阅读全文

Oracle数据库出现WARNING: too many parse errors告警的分析思路

Oracle数据库的告警日志中出WARNING: too many parse errors这些告警信息的话，如果遇到这个问题，我们应该如何分析呢？下面简单聊一下如何分析这个错误。该告警信息其实是12.2版本中的一个特性增强。在以前的Oracle版本中，数据库出现了解析错误时，数据库的alert日 ...阅读全文

重磅新品发布！云耀数据库HRDS，享受轻量级的极致体验

本文分享自华为云社区《重磅新品发布！云耀数据库HRDS，享受轻量级的极致体验！》，作者：GaussDB 数据库。所谓，凡有井水处，即能歌柳词。大数据时代，凡有数据处，必有数据库。随着业务需求的不断扩大和数据量的激增，数据库的使用场景渗透到了生活的方方面面，不再是大型企业或技术部门的专利，市场对 ...阅读全文