当前位置: 首页 > news >正文

网站页面统计代码是什么中国建设工程信息网站

网站页面统计代码是什么,中国建设工程信息网站,免费开店铺,网站建设选哪个公司作者#xff1a;来自 Elastic Dmitrii Burlutskii 在 Elastic 的搜索团队中#xff0c;我们一直在探索不同的 ETL 工具以及如何利用它们将数据传输到 Elasticsearch#xff0c;并在传输的数据上实现 AI 助力搜索。今天#xff0c;我想与大家分享我们与 Meltano 生态系统以及…作者来自 Elastic Dmitrii Burlutskii 在 Elastic 的搜索团队中我们一直在探索不同的 ETL 工具以及如何利用它们将数据传输到 Elasticsearch并在传输的数据上实现 AI 助力搜索。今天我想与大家分享我们与 Meltano 生态系统以及 Meltano Elasticsearch 加载器的故事。 Meltano 是一个声明式的代码优先数据集成引擎允许你在不同的存储之间同步数据。在 hub.meltano.com 上有许提取器 (extractors) 和加载器 (loaders) 可用。如果你的数据存储在 Snowflake 中并且想要为你的客户构建一个开箱即用的搜索体验你可能会考虑使用 Elasticsearch在那里你可以基于你拥有的数据为客户构建语义搜索。今天我们将重点介绍如何将数据从 Snowflake 同步到 Elasticsearch。 要求 Snowflake 账号。 你在注册后将收到以下所有账号信息或者你可以从 Snowflake 面板中获取它们。 账户用户名账户密码账户标识符查看此处的说明以获取它 Snowflake 数据集 如果你创建了一个新的 Snowflake 账户你将拥有用于实验的示例数据。 然而我将使用一个公共空气质量数据集其中包含二氧化氮NO2的测量数据。 Elastic 账号 访问 https://cloud.elastic.co 并注册账号。 点击 “Create deployment”。在弹出窗口中你可以更改或保留默认设置。 一旦准备好部署请点击 “Continue”或点击 “Open Kibana”。它将重定向你到 Kibana 仪表板。 转到 Stack Management - Security - API keys并生成一个新的 API 密钥。 安装 Meltano 在我的示例中我将使用 Meltano Python 包但你也可以将其作为 Docker 容器安装。 pip install meltano 添加 Snowflake 提取器 meltano add extractor tap-snowflake --variantmeltanolabs 验证提取器 meltano invoke tap-snowflake --test 添加 Elasticsearch 加载器 meltano add loader target-elasticsearch 配置提取器和加载器 有多种方法可以配置 Meltano 提取器和加载器 编辑 meltano.yml使用 CLI 命令例如 meltano config {loader} set config_name config_value 使用 CLI 交互模式 meltano config {loader} set --interactive 我将使用交互模式。 要配置 Snowflake 提取器请运行以下命令并至少提​​供帐户标识符、用户名、密码和数据库。 meltano config tap-snowflake set --interactive 你应该会看到以下屏幕你可以在其中选择要配置的选项。 配置提取后你可以测试连接。 只需运行以下命令 配置 Elasticsearch 加载器并提供主机、端口、架构和 API 密钥 meltano config target-elasticsearch set --interactive 如果你想更改索引名称可以运行以下命令并更改它 meltano config target-elasticsearch set index_format my-index-name meltano config target-elasticsearch set index_format my-index-name 比如 默认索引字符串定义为 ecs-{{ stream_name }}-{{ current_timestamp_daily}} 结果为 ecs-animals-2022-12-25其中流名称为 animals。 配置完所有内容后我们就可以开始同步数据。 meltano run tap-snowflake target-elasticsearch 同步开始后你可以转到 Kibana 并看到创建了一个新索引并且有一些索引文档。 你可以通过单击索引名称来查看文档。 你应该查看你的文件。 使用你的索引设置或映射 如果我们开始同步数据加载器将自动创建一个具有动态映射的新索引这意味着 Elasticsearch 将处理索引中的字段及其类型。 如果我们愿意我们可以通过提前创建索引并应用我们需要的设置来更改此行为。 咱们试试吧。 导航到 Kibana - DevTools 并运行以下命令 创建新的摄入管道 PUT _ingest/pipeline/drop-values-10 {processors: [{drop: {description: Drop documents with the value 10,if: ctx.datavalue 10}}] } 这将删除 datavalue 10 的所有文档。 创建新索引 PUT my-snowflake-data 应用索引设置 PUT my-snowflake-data/_settings {index: {default_pipeline: _ingest/pipeline/drop-values-10} } 更改 Meltano 中的索引名称 meltano config target-elasticsearch set index_format my-snowflake-data 开始同步作业 meltano run tap-snowflake target-elasticsearch 工作完成后你可以看到索引中的文档比我们之前创建的要少 结论 我们已经成功地将数据从 Snowflake 同步到 Elastic Cloud。我们让 Meltano 为我们创建了一个新索引并负责索引映射我们将数据同步到了一个具有预定义管道的现有索引中。 我想强调在我旅程中记下的一些关键点 Elasticsearch 加载器Meltano Hub 上的页面 它尚未准备好处理大量的数据。你需要调整默认的 Elasticsearch 配置使其更加健壮。我已经提交了一个 Pull Request以暴露 “request_timeout” 和 “retry_on_timeout” 选项这将会有所帮助。它使用 Elasticsearch Python 客户端的 8.x 分支因此你可以确保它支持最新的 Elasticsearch 功能。它同步发送数据不使用 Python AsyncIO因此当您需要传输大量数据时可能会相当慢。 Meltano CLI 它非常棒。你不需要 UI所以一切都可以在终端中配置这为工程师提供了大量的自动化选项。你可以仅通过一个命令即可运行按需同步。不需要其他正在运行的服务。 复制/增量同步 如果你的管道需要数据复制或增量同步你可以访问这个页面信息。 另外我想提一下 Meltano Hub 真的很棒。它易于导航并找到你需要的内容。此外你可以通过查看有多少客户使用它们来轻松比较不同的加载器或抽取器。 如果你对构建基于 AI 的应用程序感兴趣请在以下博客文章中查找更多信息 在你的数据集上实现全文和语义搜索能力。连接你的数据与 LLMs构建问题 - 答案。构建一个使用检索增强生成RAG模式的聊天机器人。 准备将 RAG 构建到你的应用中了吗想要尝试不同的 LLMs 与向量数据库吗 查看我们在 Github 上关于 LangChain、Cohere 等的示例 notebooks并加入即将开始的 Elasticsearch 工程师培训 原文Ingest Data from Snowflake to Elasticsearch using Meltano: A developer’s journey — Elastic Search Labs
http://www.zqtcl.cn/news/444485/

相关文章:

  • 比邻店网站开发企查查企业信息查询在线
  • 家乡网站建设策划案专业建设专题网站
  • 网站建设公司挣钱吗wordpress评论内容密码保护
  • 上海专业建站最低价网站程序模板
  • 蚌埠网站建设哪家好创客贴官网
  • php网站建设参考文献wordpress 头像 很慢
  • 大连seo网站推广phpcmsv9手机网站源码
  • 公司做推广做网站好还是俄文网站引擎
  • 上海市建设咨询协会网站asp网站源码
  • 大家都在哪些网站上做医药招商wordpress po文件
  • 国外主题网站兰州app
  • 建设项目自主验收公示网站dedecms英文外贸网站企业模板下载
  • 做网站要服务器吗前端企业网站开发
  • 用html写一个个人介绍多网站怎么做seo
  • 做网站打广告犯法吗中国建设投资集团 网站首页
  • 怎么免费申请个人网站职业技能培训有哪些
  • 小型的企业网站湖南备案网站建设方案书
  • 现在做网站公司seo怎么做教程
  • asp化妆品网站windows优化大师有必要安装吗
  • 网站流量分析系统制作图片网站
  • 做网站技术路线广州番禺发布公众号
  • 企业网站自己可以做吗服装网站建设的利益分析
  • 网站做软件居众装饰集团有限公司
  • 南山网站制作联系电话芒果国际影城星沙店
  • 珠海网站设计费用建企业版网站多久
  • linux 网站搬家wordpress 卸载plugin
  • 江苏省建设厅网站 投诉编辑网站的软件手机
  • 深圳地图各区分布图seo网络优化师就业前景
  • 北京网站备案代理国家企业信用信息公示系统广东
  • 推销网站重庆网站优化公司哪家便宜