北京Strata + Hadoop World大會 -- 全球大數據軟件領導者Syncsort今天宣布,該公司將在其居于業內領先地位的數據集成軟件DMX-h v9的漢語版和日語版中推出最新功能,以支持亞太地區(APAC)日益增長的大數據分析需求。這些新功能使企業能夠在單一服務器上或借助Apache Hadoop和Apache Spark,獲取和集成整個企業的數據流,讓客戶隨后能夠就地和在云端上利用先進分析來獲得競爭優勢。
近期的行業分析研究表明在開源框架內顛覆性技術創新繼續進行的大背景下,亞太地區采用Hadoop的水平繼續提升。此外,一系列行業分析公司的研究還指出大數據容量和類型繼續擴展,以及對分析日益增長的需求將成為推動全球(包括亞太地區)采用Hadoop的主要因素。
Syncsort大數據業務總經理Tendü Yo?urt?u表示:“越來越多的Syncsort亞太地區客戶尋求通過在大數據環境中利用整個企業的數據,獲得競爭優勢。現在面向所有企業數據——包括大型機和現有數據庫——的無與倫比的數據獲取和集成能力將能以當地語言提供,這能幫助在中國、日本及整個亞太地區處理許多關鍵用例。”
新發布的Syncsort DMX-h讓企業輕松安全地獲取和集成來自于多個企業數據源的批量和實時數據流,包括供應Hadoop與Spark的相同數據管道內的Kafka、大型機、關系數據庫和非結構化數據源,從而借此為這些用例提供支持。
DMX-h目前在亞太地區推出了本地化語言版本,其近期新增功能包括:
一次性設計,能在單一服務器、Hadoop或Spark上部署——憑借DMX-h v9,單一的ETL工作能夠進行設計,在本地機器上進行測試,并在Apache Hadoop、MapReduce、Spark、Linux、UNIX和Windows上進行就地/云端生產部署。相同的工作能夠被轉移至一個Hadoop集群,并在MapReduce或Spark上開展,而且無需任何其它的設計更改或重新編譯。只需選擇圖形用戶界面中下拉菜單的執行框架,工作就能從獨立服務器轉移到MapReduce,再轉移到Spark。這種功能意味著使用Syncsort解決方案的企業能夠確信,利用DMX/DMX-h設計的新老數據集成應用能夠在無需進行任何更改的情況下,移植到新的計算框架中。如此面向未來的DMX-h應用完全可以應對大數據技術堆棧的快速發展演化。
利用智能化執行(IX)來縮短實現價值的時間——Syncsort的DMX-h采用智能化執行,可通過減少通常用于性能優化的較高費用和較長時間工時,縮短公司在部署大數據集成方面實現價值的時間。眾多數據集成工具需要非常熟練的開發人員耗費數小時,甚至數天來調整執行設置和應用策略,從而在特定的硬件環境中實現良好性能,或者用于特定類型的工作任務。DMX-h可根據運行之中的既定計算框架來自動優化應用執行,從而使用戶能關注于需要完成的工作。這不僅能縮短開發時間,還支持在多種環境下以卓越的效果執行相同的工作,無需任何手動的重新設計或重新編譯。這種功能顯著簡化了從獨立服務器環境向集群環境或云端轉移應用的過程。
串流用于實時分析的數據獲取和集成——Syncsort與Kafka分布式消息系統和MapR Streams的整合使用戶能利用DMX-h操作簡單的圖形界面,訂閱、轉換并豐富來自傳感器數據、現場處理數據和Web數據流等實時來源的整個企業數據。DMX-h在同一個工作任務中獲取并集成大型機數據、現有數據庫和來自Hadoop文件等大數據存儲庫的數據方面具有無與倫比的能力,同時串流來源可簡化串流數據的豐富過程。它使企業能容納歷史處理數據,以及移動和物聯網(IoT)等實時數據來源。DMX-h還可向Kafka和MapR Streams發布這些內容豐富的數據集,從而通過清理、預先處理和轉換動態數據來簡化實時分析應用的開發。
集成采用各種字符編碼集、各種語言的數據——Syncsort DMX-h一直大力支持多字節的Unicode編碼數據處理過程,并且目前DMX-h v9能為各種支持ICU的代碼頁面提供支持。這意味著各種數據,無論來自何處,目前均能為企業所用。此外,對COBOL Copybooks等元數據文件的本地化支持還簡化了原先難以獲取的數據的獲取與集成過程。依托Syncsort DMX-h,所用數據,無論采用何種字符編碼集,還是采用何種國家的語言,均可進行集成。
DMX-h v9本地化的漢語版和日語版將于今年9月底推出。