Loading...
1 数据仓库的概念数据仓库(Data Warehouse),是为企业所有决策制定过程,提供所有系统数据支持的战略集合。通过对数据仓库中数据的分析,可以帮助企业,改进业务流程、控制成本、题号提高产品质量等。数据仓科,并不是数据的最终目的地,而是为数据最终的目的地做好准备。这些准备包括对数据的:清洗、转义、分类、重组、合并、拆分、统计等等。2 项目需求分析用户行为数据采集平台搭建业务数据采集平台...
1 Apache POI1.1 POI简介Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能。Apache POI官网地址:https://poi.apache.org/1.2 基本结构HSSF - 提供读写Microsoft Excel格式档案的功能。03版本的excel,即<font c...
1 Flink简介Flink 项目的理念是:“Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架”。Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink 被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。2 为什么选择Flink流数据更真实地反映生活方式传统的数据架构是基于优...
1 查询所有文档1.1 http请求1.1.1 查询所有索引库的文档urlpost http://localhost:9200/_search1.1.2 查询指定索引库指定类型下的文档urlpost http://localhost:9200/xc_course/doc/_search1.1.3 请求体json{ "query": { "...
1. 映射1.1 字段类型(type)1.1.1 字符串1.1.1.1 text指定分析器analyzer会对文本进行分词“name”: { "type": "text", "analyzer": "ik_max_word", "search_analyzer": &q...