
Apache IoTDB清華大學(xué)主導(dǎo)的Apache孵化項目
IoTDB 是清華大學(xué)主導(dǎo)的 Apache 孵化項目,是一款聚焦工業(yè)物聯(lián)網(wǎng)、高性能輕量級的時序數(shù)據(jù)管理系統(tǒng),提供數(shù)據(jù)采集、存儲、分析的功能。IoTDB 提供端云一體化的解決方案,在云端,提供高性能的數(shù)據(jù)讀寫以及豐富的查詢能力,針對物聯(lián)網(wǎng)場景定制高效的目錄組織結(jié)構(gòu),并與 Apache Hadoop、Spark、Flink 等大數(shù)據(jù)系統(tǒng)無縫打通;在邊緣端,提供輕量化的 TsFile 管理能力,端上的數(shù)據(jù)寫到本地 TsFile,并提供一定的基礎(chǔ)查詢能力,同時支持將 TsFile 數(shù)據(jù)同步到云端。
IoTDB 具備低存儲成本、高速數(shù)據(jù)寫入(百萬數(shù)據(jù)點(diǎn)秒級寫入)、快速查詢(TB級數(shù)據(jù)毫秒級查詢)、功能完備(數(shù)據(jù)的增刪改查、豐富的聚合函數(shù)、相似性匹配)、查詢分析一體化(一份數(shù)據(jù),滿足實時查詢與分析挖掘)、簡單易用(采用標(biāo)準(zhǔn)的 JDBC 接口、類 SQL 查詢語言)等特點(diǎn)。
基準(zhǔn)測試表明IoTDB讀寫性能均優(yōu)于現(xiàn)有的時序數(shù)據(jù)庫InfluxDB、OpenTSDB、Cassandra以及GE的工業(yè)大數(shù)據(jù)平臺Predix。根據(jù)中國軟件評測中心和中國人民大學(xué)的性能對標(biāo)測試,IoTDB的各項性能指標(biāo)均明顯優(yōu)于當(dāng)今國際最優(yōu)的時序數(shù)據(jù)庫系統(tǒng)。
產(chǎn)品功能
查詢引擎
IoTDB 內(nèi)置查詢引擎負(fù)責(zé)所有用戶命令的解析、生成計劃、交給對應(yīng)的執(zhí)行器、返回結(jié)果集。IoTDB 通過查詢引擎提供了 JDBC 訪問 API,簡單易用。
元數(shù)據(jù)管理
IoTDB 的元數(shù)據(jù)模型采用樹狀結(jié)構(gòu)組織,一個實例包含多個 Storage Group (類似于 Namespace、Database 的概念),一個 Storage Group 里包含多個 Device ,每個 Device 包含多個 Measurement , Measurement 對應(yīng)的時間序列數(shù)據(jù)最終存儲在 TsFile Chunk 里。另外,為了方便數(shù)據(jù)過期,每個 Stroage Group 的數(shù)據(jù)會以時間范圍的形式切分存儲,默認(rèn)以周為單位,使用不同的目錄存儲。
存儲引擎
IoTDB 存儲引擎基于 LSM Tree 結(jié)構(gòu)設(shè)計,寫入的數(shù)據(jù)先記錄 WAL,再寫到內(nèi)存 memtable,在后臺逐步刷到磁盤 TsFile;磁盤上的 TsFile 通過一定的規(guī)則進(jìn)行 Compaction,保證查詢效率。
同步工具
IoTDB 支持在邊緣側(cè)、云端部署,通常在邊緣側(cè)采集的數(shù)據(jù)有同步到遠(yuǎn)端進(jìn)一步分析處理的需求;IoTDB 提供了同步工具,支持將端/設(shè)備上的 TsFile 數(shù)據(jù)往云端同步。
連接器
IoTDB 支持與現(xiàn)有的大數(shù)據(jù)處理系統(tǒng),包括 Hive、Spark 等無縫連通,IoTDB 提供了 hive-tsfile 、 spark-tsfile 、 spark-iotdb 等連接器,讓 Hive、Spark 能直接訪問 tsfile 格式的數(shù)據(jù),以及訪問 IoTDB 的數(shù)據(jù)。
產(chǎn)品優(yōu)勢
針對物聯(lián)網(wǎng)模型做了定制化,提供 JDBC 訪問方式,支持邊云一體化部署。
存儲使用 Hadoop File system,并提供多種 connector,與現(xiàn)有大數(shù)據(jù)生態(tài)無縫打通。
開放的 TsFile 存儲格式,設(shè)備模型簡單易理解。
IoTDB 架構(gòu)圖
IoTDB 于 2017 年 1 月正式在 Github 上開放 IoTDB 底層文件存儲格式 TsFile。2017年至2018年,IoTDB保持持續(xù)開發(fā),先后發(fā)布0.3,0.4,0.5,0.6,0.7等五個版本。
目前,IoTDB已完成與開源大數(shù)據(jù)生態(tài)(Hadoop、Spark)的集成,實現(xiàn)了相關(guān)的編程SDK(JDBC形式)、導(dǎo)入導(dǎo)出工具、可視化工具、命令行交互工具、數(shù)據(jù)回傳工具等多項 IoTDB 輔助工具,大幅度提升了IoTDB的適應(yīng)力。截止目前,IoTDB核心模塊有效代碼達(dá)7萬余行,通過DSL語言生成代碼6萬余行。IoTDB代碼提交更新次數(shù)超過1300次,用戶反饋、建議與回復(fù)200余次。
應(yīng)用場景
云數(shù)據(jù)管理
在高速網(wǎng)絡(luò)(車聯(lián)網(wǎng)等)的場景中,安裝有傳感器的汽車可以以一定頻率收集自身的監(jiān)視信息(行駛狀態(tài)等)。 通常,這些汽車設(shè)備的硬件配置有限,并且難以進(jìn)行復(fù)雜的應(yīng)用。 輕量級的IoTDB(IoTDB客戶端)應(yīng)運(yùn)而生。 借助JDBC API(或MQTT),它可以使用窄帶IoT或4G/5G發(fā)送數(shù)據(jù),從而將設(shè)備和云連接在一起。
高端設(shè)備
在高端制造業(yè)中,有很多設(shè)備配備有傳感器來收集工作狀態(tài)數(shù)據(jù),例如氣象站,風(fēng)力渦輪機(jī)是常見的高端設(shè)備。這些設(shè)備如果支持Java或Go(正在開發(fā)中),則可以運(yùn)行TsFile在本地存儲數(shù)據(jù)。通過這種方式,TsFile可以提供具有高吞吐、高壓縮率和毫秒級查詢延遲的數(shù)據(jù)管理功能。結(jié)合TsFile-Sync工具,可以將TsFiles同步到數(shù)據(jù)中心。
本地控制器
在工廠現(xiàn)場,LAN網(wǎng)絡(luò)下有數(shù)十臺設(shè)備。 IoTDB可以安裝在工廠的本地控制器服務(wù)器上,以從這些設(shè)備接收數(shù)據(jù)。 安裝有IoTDB的本地服務(wù)器(普通PC或工作站)可以使用類SQL存儲和查詢數(shù)據(jù)。 此外,使用TsFile-Sync工具,可以將本地控制器上的TsFile文件傳輸?shù)皆粕习惭b有IoTDB實例的數(shù)據(jù)中心。
發(fā)展歷程
2018年,IoTDB進(jìn)入了開源孵化期。同年11月,IoTDB 成為Apache旗下孵化器項目,先后吸引了來自德國、美國、澳大利亞等國際同行關(guān)注。
2019年IoTDB 實現(xiàn)快速成長。項目相繼獲得優(yōu)秀大數(shù)據(jù)產(chǎn)品、中國優(yōu)秀開源項目一等獎,并在中國工業(yè)互聯(lián)網(wǎng)峰會作為重要成果作主題發(fā)布。
2020年IoTDB 成功畢業(yè)。Apache IoTDB 升為全球頂級項目,這標(biāo)志著 IoTDB 建成了全球認(rèn)可的國際開源社區(qū),并成為我國高校在Apache 社區(qū)主導(dǎo)的唯一孵化成功的項目。
2021年IoTDB入選十三五成果。Apache IoTDB參加國家“十三五”科技創(chuàng)新成就展。
相關(guān)資料
IoTDB官方網(wǎng)站:http://iotdb.apache.org/zh/
IoTDB開源地址:https://github.com/apache/iotdb
[超站]友情鏈接:
四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級服務(wù)市場:https://www.ijiandao.com/

隨時掌握互聯(lián)網(wǎng)精彩
- 1 看總書記關(guān)心的清潔能源這樣發(fā)電 7904174
- 2 今年最強(qiáng)臺風(fēng)來襲 7809623
- 3 澳加英宣布承認(rèn)巴勒斯坦國 7713627
- 4 長春航空展這些“首次”不要錯過 7618607
- 5 43歲二胎媽媽患阿爾茨海默病 7521370
- 6 iPhone 17橙色斜挎掛繩賣斷貨 7425342
- 7 老奶奶去世3年 鄰居幫打掃門前落葉 7331845
- 8 三所“零近視”小學(xué)帶來的啟示 7236423
- 9 女兒發(fā)現(xiàn)父親500多萬遺產(chǎn)用于保健 7141458
- 10 英國航母從南?!傲锪恕?/a> 7042247