咨詢郵箱?咨詢郵箱:service@yitianxinda.com 咨詢熱線?咨詢熱線:18101296137 微博 微信
北京軟件開發(fā)公司Apache Flink實(shí)現(xiàn)的數(shù)據(jù)流體系結(jié)構(gòu)_北京軟件開發(fā)公司
發(fā)表日期:2016-06-13 10:26:17 ?? 文章編輯:yitianxinda ?? 瀏覽次數(shù):

  北京軟件開發(fā)公司Apache Flink實(shí)現(xiàn)的數(shù)據(jù)流體系結(jié)構(gòu),data Artisans應(yīng)用程序工程總監(jiān)Jamie Grier較近在OSCON 2016 Conference大會(huì)發(fā)言談到了使用Apache Flink構(gòu)建的一種數(shù)據(jù)流體系結(jié)構(gòu)。同時(shí)還談到了數(shù)據(jù)流應(yīng)用程序的構(gòu)建塊。

  數(shù)據(jù)流體系結(jié)構(gòu)可用于處理隨著時(shí)間流逝以事件流方式持續(xù)生成的數(shù)據(jù),這一點(diǎn)不同于傳統(tǒng)的靜態(tài)數(shù)據(jù)集。相對(duì)于傳統(tǒng)的集中式“狀態(tài)化”數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)流應(yīng)用程序可以處理事件流以及針對(duì)歷史事件匯總而來的應(yīng)用程序本地狀態(tài)。流式數(shù)據(jù)處理的一些優(yōu)勢(shì)包括:

  降低從信號(hào)到?jīng)Q策的過程延遲

  通過統(tǒng)一的方式處理實(shí)時(shí)和歷史數(shù)據(jù) 

  Time travel查詢

  Apache Flink是一種開源的分布式流化和批量化數(shù)據(jù)處理平臺(tái)。Flink的誕生受到了Google Data Flow模型的啟發(fā),可支持Java和Scala語言開發(fā)的Stream Processing API。相比其他流式數(shù)據(jù)處理框架,F(xiàn)link中不存在微批量(Micro batching)數(shù)據(jù),而是使用了一種“一次一條消息”的流處理技術(shù)。

  Jamie介紹了狀態(tài)流處理并展示了Flink應(yīng)用程序的代碼范例,以及使用開源時(shí)序數(shù)據(jù)庫(kù)和Graphana可視化工具Influxdb進(jìn)行監(jiān)控的方法。

  同時(shí)他還介紹了流處理過程中窗口(Windowing)的概念以及處理時(shí)間(Processing Time)和事件時(shí)間(Event Time)的窗口概念。處理時(shí)間的窗口會(huì)對(duì)流數(shù)據(jù)的分析產(chǎn)生影響,并會(huì)導(dǎo)致數(shù)據(jù)處理過程中出現(xiàn)某些錯(cuò)誤。在事件時(shí)間方法中,窗口來自于數(shù)據(jù),而非時(shí)鐘時(shí)間。對(duì)于事件時(shí)間,可通過數(shù)據(jù)嵌入的時(shí)間戳對(duì)數(shù)據(jù)進(jìn)行處理,這樣即可獲得更精確的結(jié)果。

  Jamie還介紹了在應(yīng)用程序中使用Flink時(shí)的錯(cuò)誤處理和容錯(cuò)機(jī)制。Flink中的Savepoints功能可在不丟失任何狀態(tài)的情況下對(duì)程序和Flink集群進(jìn)行更新。如果要對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行流處理,此時(shí)Savepoints數(shù)據(jù)快照會(huì)顯得非常重要。

  如果你想詳細(xì)了解Apache Flink,可訪問他們的網(wǎng)站。此外Flink Forward 2016 Conference活動(dòng)將于九月在柏林召開,提交提案的截止日期為2016年6月30日。

相關(guān)文章推薦
下一代工業(yè)進(jìn)步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動(dòng)化)互聯(lián)互通并實(shí)現(xiàn)計(jì)算機(jī)化。工業(yè)4.0的目標(biāo)是使工廠變得更加智能,提高適應(yīng)性和資源效率,以及改善工廠之間供...
您正在尋找能夠?qū)⒛钊梭@嘆的應(yīng)用程序想法變?yōu)楝F(xiàn)實(shí)的人。我應(yīng)該聘請(qǐng)軟件公司還是兼職開發(fā)者?這可能是每個(gè)新晉產(chǎn)品所有者問自己的最常見問題。在開始開發(fā)過程之前,您需要...
從頭開始構(gòu)建網(wǎng)站并托管和維護(hù)或改造舊網(wǎng)站需要聘請(qǐng)一支擁有技能和專業(yè)知識(shí)的團(tuán)隊(duì)。如果您不想進(jìn)一步擴(kuò)大團(tuán)隊(duì),不想經(jīng)歷招聘大手筆,或者想降低離岸成本,北京軟件開發(fā)外包...
物聯(lián)網(wǎng) ( IoT ) 概念首次出現(xiàn)時(shí),曾有大膽預(yù)測(cè)稱,到 2020 年,物聯(lián)網(wǎng)連接設(shè)備數(shù)量將達(dá)到 500 億甚至數(shù)萬億。這些極高的估值引發(fā)了炒作,但最終被證明...
下一代工業(yè)進(jìn)步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動(dòng)化)互聯(lián)互通并實(shí)現(xiàn)計(jì)算機(jī)化。工業(yè)4.0的目標(biāo)是使工廠變得更加智能,提高適應(yīng)性和資源效率,以及改善工廠之間供...
企業(yè)需要強(qiáng)大且可靠的在線形象才能取得成功。Magento 已成為領(lǐng)先的電子商務(wù)平臺(tái),為各種規(guī)模的企業(yè)提供強(qiáng)大的功能和定制選項(xiàng)。對(duì)于希望通過基于 Magento ...
北京軟件開發(fā)公司已經(jīng)開發(fā)出一種新的軟件來預(yù)測(cè)海洋、水庫(kù)和河流中的污染源的系統(tǒng)...
北京軟件開發(fā)32T塊存儲(chǔ)分區(qū)操作手冊(cè),以下分別針對(duì) Linux 和 Windows 的 ECS 實(shí)例來介紹大盤的管理和使用。 大數(shù)據(jù)盤的分區(qū)和文件系統(tǒng)格式化和小盤都存在差異。大盤必須采用 GPT 分區(qū)格...
從頭開始構(gòu)建網(wǎng)站并托管和維護(hù)或改造舊網(wǎng)站需要聘請(qǐng)一支擁有技能和專業(yè)知識(shí)的團(tuán)隊(duì)。如果您不想進(jìn)一步擴(kuò)大團(tuán)隊(duì),不想經(jīng)歷招聘大手筆,或者想降低離岸成本,北京軟件開發(fā)外包...
網(wǎng)址:------ 接洽電話 -----對(duì)待北京軟件開墾公司本文由:()宣布,我們?cè)诮蟍浙江 江蘇 上海]你領(lǐng)會(huì)殊勝區(qū)域,電話) 接洽方式 北京殊勝新聞科技軟件外包開墾郵箱: 北京軟件開發(fā)公...
為什么我們接受速度作為軟件開發(fā)中毫無疑問的法令?當(dāng)我們這樣做時(shí),我們會(huì)問自己:在引入數(shù)字化轉(zhuǎn)型過程中不疏遠(yuǎn)客戶的前提下,引入智能機(jī)器的最佳方法是什么? 要了解速度起...
北京軟件開發(fā)公司認(rèn)為信息和軟件技術(shù)的重點(diǎn)是研究和經(jīng)驗(yàn),...
?