咨詢郵箱?咨詢郵箱:service@yitianxinda.com 咨詢熱線?咨詢熱線:18101296137 微博 微信
北京軟件開發(fā)公司Apache Flink實現(xiàn)的數(shù)據(jù)流體系結(jié)構(gòu)_北京軟件開發(fā)公司
發(fā)表日期:2016-06-13 10:26:17 ?? 文章編輯:yitianxinda ?? 瀏覽次數(shù):

  北京軟件開發(fā)公司Apache Flink實現(xiàn)的數(shù)據(jù)流體系結(jié)構(gòu),data Artisans應(yīng)用程序工程總監(jiān)Jamie Grier較近在OSCON 2016 Conference大會發(fā)言談到了使用Apache Flink構(gòu)建的一種數(shù)據(jù)流體系結(jié)構(gòu)。同時還談到了數(shù)據(jù)流應(yīng)用程序的構(gòu)建塊。

  數(shù)據(jù)流體系結(jié)構(gòu)可用于處理隨著時間流逝以事件流方式持續(xù)生成的數(shù)據(jù),這一點不同于傳統(tǒng)的靜態(tài)數(shù)據(jù)集。相對于傳統(tǒng)的集中式“狀態(tài)化”數(shù)據(jù)庫和數(shù)據(jù)倉庫,數(shù)據(jù)流應(yīng)用程序可以處理事件流以及針對歷史事件匯總而來的應(yīng)用程序本地狀態(tài)。流式數(shù)據(jù)處理的一些優(yōu)勢包括:

  降低從信號到?jīng)Q策的過程延遲

  通過統(tǒng)一的方式處理實時和歷史數(shù)據(jù) 

  Time travel查詢

  Apache Flink是一種開源的分布式流化和批量化數(shù)據(jù)處理平臺。Flink的誕生受到了Google Data Flow模型的啟發(fā),可支持Java和Scala語言開發(fā)的Stream Processing API。相比其他流式數(shù)據(jù)處理框架,F(xiàn)link中不存在微批量(Micro batching)數(shù)據(jù),而是使用了一種“一次一條消息”的流處理技術(shù)。

  Jamie介紹了狀態(tài)流處理并展示了Flink應(yīng)用程序的代碼范例,以及使用開源時序數(shù)據(jù)庫和Graphana可視化工具Influxdb進(jìn)行監(jiān)控的方法。

  同時他還介紹了流處理過程中窗口(Windowing)的概念以及處理時間(Processing Time)和事件時間(Event Time)的窗口概念。處理時間的窗口會對流數(shù)據(jù)的分析產(chǎn)生影響,并會導(dǎo)致數(shù)據(jù)處理過程中出現(xiàn)某些錯誤。在事件時間方法中,窗口來自于數(shù)據(jù),而非時鐘時間。對于事件時間,可通過數(shù)據(jù)嵌入的時間戳對數(shù)據(jù)進(jìn)行處理,這樣即可獲得更精確的結(jié)果。

  Jamie還介紹了在應(yīng)用程序中使用Flink時的錯誤處理和容錯機(jī)制。Flink中的Savepoints功能可在不丟失任何狀態(tài)的情況下對程序和Flink集群進(jìn)行更新。如果要對實時數(shù)據(jù)進(jìn)行流處理,此時Savepoints數(shù)據(jù)快照會顯得非常重要。

  如果你想詳細(xì)了解Apache Flink,可訪問他們的網(wǎng)站。此外Flink Forward 2016 Conference活動將于九月在柏林召開,提交提案的截止日期為2016年6月30日。

相關(guān)文章推薦
下一代工業(yè)進(jìn)步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動化)互聯(lián)互通并實現(xiàn)計算機(jī)化。工業(yè)4.0的目標(biāo)是使工廠變得更加智能,提高適應(yīng)性和資源效率,以及改善工廠之間供...
您正在尋找能夠?qū)⒛钊梭@嘆的應(yīng)用程序想法變?yōu)楝F(xiàn)實的人。我應(yīng)該聘請軟件公司還是兼職開發(fā)者?這可能是每個新晉產(chǎn)品所有者問自己的最常見問題。在開始開發(fā)過程之前,您需要...
從頭開始構(gòu)建網(wǎng)站并托管和維護(hù)或改造舊網(wǎng)站需要聘請一支擁有技能和專業(yè)知識的團(tuán)隊。如果您不想進(jìn)一步擴(kuò)大團(tuán)隊,不想經(jīng)歷招聘大手筆,或者想降低離岸成本,北京軟件開發(fā)外包...
物聯(lián)網(wǎng) ( IoT ) 概念首次出現(xiàn)時,曾有大膽預(yù)測稱,到 2020 年,物聯(lián)網(wǎng)連接設(shè)備數(shù)量將達(dá)到 500 億甚至數(shù)萬億。這些極高的估值引發(fā)了炒作,但最終被證明...
下一代工業(yè)進(jìn)步被稱為工業(yè)4.0,旨在將傳統(tǒng)行業(yè)(如自動化)互聯(lián)互通并實現(xiàn)計算機(jī)化。工業(yè)4.0的目標(biāo)是使工廠變得更加智能,提高適應(yīng)性和資源效率,以及改善工廠之間供...
企業(yè)需要強(qiáng)大且可靠的在線形象才能取得成功。Magento 已成為領(lǐng)先的電子商務(wù)平臺,為各種規(guī)模的企業(yè)提供強(qiáng)大的功能和定制選項。對于希望通過基于 Magento ...
北京軟件開發(fā)公司系統(tǒng)安全是整個系統(tǒng)可靠運(yùn)行和進(jìn)行安全防范的基石,系統(tǒng)安全設(shè)計需要在統(tǒng)一設(shè)計的原則下,在不同的安全層次,在預(yù)防、檢測和恢復(fù)等各個階段,確保系統(tǒng)持續(xù)穩(wěn)...
北京軟件開發(fā)公司已經(jīng)開發(fā)出一種新的軟件來預(yù)測海洋、水庫和河流中的污染源的系統(tǒng)...
北京軟件公司圍繞“客戶”進(jìn)行調(diào)研 提升CRM項目成功率...
盡管軟件開發(fā)商務(wù)智能(BI)相當(dāng)成熟,但當(dāng)今的大多數(shù)見解都是描述性的,而不是預(yù)測性的和說明性的。由于過去和現(xiàn)在并不總是一帆風(fēng)順,因此BI不足以使企業(yè)能夠從對數(shù)據(jù)分析的投...
北京軟件開發(fā)公司Apache Flink實現(xiàn)的數(shù)據(jù)流體系結(jié)構(gòu)...
而我們以為:“軟件其實就是一種動力” 那種結(jié)果感是無與倫比的。 可能這才是她的真正魅力所在,能有一個運(yùn)轉(zhuǎn)流利的軟件把這一切都搞定,同時當(dāng)把全盤的需求理解全盤的難點全...
?