2017下半年系統(tǒng)集成項目管理工程師真題試題解析:
23、 在將數(shù)據(jù)源經(jīng)過分析挖掘到最終獲得價值的大數(shù)據(jù)處理過程中,MapReduce是在( )階段應用分布式并行處理關鍵技術的常用工具。
A、數(shù)據(jù)采集
B、數(shù)據(jù)管理
C、數(shù)據(jù)存儲
D、數(shù)據(jù)分析與挖掘
信管網(wǎng)解析:
大數(shù)據(jù)所涉及的技術很多,主要包括數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)管理、數(shù)據(jù)分析與挖掘四個環(huán)節(jié)。
在數(shù)據(jù)采集階段主要使用的技術是數(shù)據(jù)抽取工具 ETL。
在數(shù)據(jù)存儲環(huán)節(jié)主要有結構化數(shù)據(jù)、非結構化數(shù)據(jù)和半結構化數(shù)據(jù)的存儲與訪問。結構化數(shù)據(jù)一般存放在關系數(shù)據(jù)庫,通過數(shù)據(jù)查詢語言( SQL)來訪問;非結構化(如圖片、視頻、 doc文件等)和半結構化數(shù)據(jù)一般通過分布式文件系統(tǒng)的 NoSQL(Not Only SQL)進行存儲,比較典型的 NoSQL有 Google的 Bigtable、Amazon的 Dynamo和 Apache的 Hbase。
大數(shù)據(jù)管理主要使用了分布式并行處理技術,比較常用的有 MapReduce,編程人員借助 MapReduce可以在不會分布式并行編程的情況下,將自己的程序運行在分布式系統(tǒng)上。
數(shù)據(jù)分析與挖掘是根據(jù)業(yè)務需求對大數(shù)據(jù)進行關聯(lián)、聚類、分類等鉆取和分析,并利用圖形、表格加以展示,與 ETL一樣,數(shù)據(jù)分析和挖掘是以前數(shù)據(jù)倉庫的范疇,只是在大數(shù)據(jù)中得以更好的利用。
大數(shù)據(jù)關鍵技術:http://m.ichunya.com/pm1/36066.html
信管網(wǎng)參考答案:B
溫馨提示:因考試政策、內容不斷變化與調整,信管網(wǎng)網(wǎng)站提供的以上信息僅供參考,如有異議,請以權威部門公布的內容為準!
信管網(wǎng)致力于為廣大信管從業(yè)人員、愛好者、大學生提供專業(yè)、高質量的課程和服務,解決其考試證書、技能提升和就業(yè)的需求。
信管網(wǎng)軟考課程由信管網(wǎng)依托10年專業(yè)軟考教研傾力打造,官方教材參編作者和資深講師坐鎮(zhèn),通過深研歷年考試出題規(guī)律與考試大綱,深挖核心知識與高頻考點,為學員考試保駕護航。面授、直播&錄播,多種班型靈活學習,滿足不同學員考證需求,降低課程學習難度,使學習效果事半功倍。
發(fā)表評論 查看完整評論 | |