旗下產(chǎn)業(yè): A產(chǎn)業(yè)/?A實習(xí)/?A計劃
全國統(tǒng)一咨詢熱線:010-5367 2995
首頁 > 熱門文章 > 大數(shù)據(jù)分析 > 大數(shù)據(jù)分析面試題庫-有經(jīng)驗的大數(shù)據(jù)分析面試問題

大數(shù)據(jù)分析面試題庫-有經(jīng)驗的大數(shù)據(jù)分析面試問題

時間:2019-12-26來源:m.lb577.com點擊量:作者:Sissi
時間:2019-12-26點擊量:作者:Sissi



  之前我分享了《大數(shù)據(jù)分析面試題庫—基本的大數(shù)據(jù)分析面試問題》,這個是針對基本的大數(shù)據(jù)分析問題,如果您在大數(shù)據(jù)分析世界中有相當豐富的工作經(jīng)驗,那么根據(jù)您以前的經(jīng)驗,您將在大數(shù)據(jù)分析采訪中被問到許多問題。這些問題可能只是與您的經(jīng)驗或場景有關(guān)。因此,AAA教育為您準備好這些最佳的大數(shù)據(jù)分析面試問題和答案。

 

11.您有大數(shù)據(jù)分析經(jīng)驗嗎?
 

  如何處理: 由于該問題是主觀問題,因此沒有具體答案,并且答案取決于您以前的經(jīng)驗。在大數(shù)據(jù)分析采訪中問這個問題時,采訪者想了解您以前的經(jīng)驗,并且還試圖評估您是否適合項目要求。
 

  那么,您將如何處理這個問題?如果您以前有經(jīng)驗,請從以前的職務(wù)開始,然后慢慢地在對話中添加細節(jié)。告訴他們您使項目成功的貢獻。這個問題通常是面試中問到的第二個 或第三個問題。后面的問題基于此問題,因此請仔細回答。您還應(yīng)該注意不要過度處理以前的工作。保持簡單明了。
 

12.您喜歡好的數(shù)據(jù)還是好的模型?為什么?
 

  如何處理: 這是一個棘手的問題,但通常在大數(shù)據(jù)分析面試中會問到。它要求您在良好的數(shù)據(jù)或良好的模型之間進行選擇。作為候選人,您應(yīng)該嘗試根據(jù)自己的經(jīng)驗來回答。許多公司希望遵循嚴格的數(shù)據(jù)評估流程,這意味著他們已經(jīng)選擇了數(shù)據(jù)模型。在這種情況下,擁有良好的數(shù)據(jù)可能會改變游戲規(guī)則。另一種方法是根據(jù)良好的數(shù)據(jù)選擇模型。
 

  如前所述,請根據(jù)您的經(jīng)驗進行回答。但是,不要說擁有良好的數(shù)據(jù)和良好的模型很重要,因為在現(xiàn)實生活中很難同時擁有兩者。
 

13.您是否會優(yōu)化算法或代碼以使其運行更快?
 

  如何處理: 這個問題的答案應(yīng)該始終是“是”。真實世界的性能很重要,它并不取決于您在項目中使用的數(shù)據(jù)或模型。
 

  面試官也可能想知道您以前是否有代碼或算法優(yōu)化方面的經(jīng)驗。對于初學(xué)者而言,這顯然取決于他過去從事的項目。經(jīng)驗豐富的候選人也可以相應(yīng)地分享他們的經(jīng)驗。但是,請誠實對待您的工作,如果您過去沒有優(yōu)化代碼,那也很好。只要讓面試官知道您的真實經(jīng)驗,您就可以破解大數(shù)據(jù)分析面試。

大數(shù)據(jù)分析
 

14.您如何進行數(shù)據(jù)準備?
 

  如何進行: 數(shù)據(jù)準備是大數(shù)據(jù)分析項目中的關(guān)鍵步驟之一。大數(shù)據(jù)分析采訪可能涉及基于數(shù)據(jù)準備的至少一個問題。當面試官問您這個問題時,他想知道您在數(shù)據(jù)準備過程中采取了哪些步驟或預(yù)防措施。
 

  如您所知,需要進行數(shù)據(jù)準備才能獲得必要的數(shù)據(jù),然后可以將這些數(shù)據(jù)進一步用于建模目的。您應(yīng)該將此信息傳達給面試官。您還應(yīng)該強調(diào)要使用的模型的類型以及選擇該特定模型的原因。最后但并非最不重要的一點,您還應(yīng)該討論重要的數(shù)據(jù)準備術(shù)語,例如轉(zhuǎn)換變量,離群值,非結(jié)構(gòu)化數(shù)據(jù),識別差距等。
 

15.如何將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)?
 

  如何處理: 非結(jié)構(gòu)化數(shù)據(jù)在大數(shù)據(jù)分析中非常常見。應(yīng)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù),以確保進行正確的數(shù)據(jù)分析。您可以通過簡要區(qū)分兩者來開始回答問題。完成后,您現(xiàn)在可以討論將一種形式轉(zhuǎn)換為另一種形式的方法。您也可能會分享實際情況。如果您剛畢業(yè),則可以共享與您的學(xué)術(shù)項目有關(guān)的信息。
 

  通過正確回答此問題,表示您了解結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)類型,并且具有處理這些數(shù)據(jù)的實踐經(jīng)驗。如果您具體回答該問題,那么您肯定可以破解大數(shù)據(jù)分析采訪。
 

16.哪種硬件配置最適合Hadoop作業(yè)?
 

  配置4/8 GB RAM和ECC內(nèi)存的雙處理器或核心計算機是運行Hadoop操作的理想選擇。但是,硬件配置會根據(jù)特定于項目的工作流和處理流程而有所不同,因此需要進行相應(yīng)的自定義。
 

17、當兩個用戶嘗試訪問HDFS中的相同文件時會發(fā)生什么?
 

  HDFS NameNode僅支持獨占寫入。因此,只有第一個用戶將獲得文件訪問許可,而第二個用戶將被拒絕。
 

18、NameNode出現(xiàn)故障時如何恢復(fù)?
 

  需要執(zhí)行以下步驟以使Hadoop集群啟動并運行:

  使用文件系統(tǒng)元數(shù)據(jù)副本FsImage來啟動新的NameNode。

  配置數(shù)據(jù)節(jié)點以及客戶端,以使它們確認新啟動的名稱節(jié)點。

  一旦新的NameNode完成加載最后一個從DataNode接收到足夠阻止報告的檢查點FsImage,它將開始為客戶端提供服務(wù)。

  在大型Hadoop集群的情況下,NameNode恢復(fù)過程會耗費大量時間,這對于例行維護而言是一個更大的挑戰(zhàn)。
 

19、您對Hadoop中的Rack Awareness了解什么?
 

  這是應(yīng)用于NameNode的算法,用于確定如何放置塊及其副本。根據(jù)機架定義,可將同一機架內(nèi)各DataNode之間的網(wǎng)絡(luò)流量最小化。例如,如果我們考慮復(fù)制因子為3,則將兩個副本放在一個機架中,而將第三副本放在一個單獨的機架中。
 

20、“ HDFS塊”和“輸入分割”之間有什么區(qū)別?
 

  HDFS將輸入數(shù)據(jù)物理上劃分為塊進行處理,這稱為HDFS塊。

  輸入拆分是映射器對數(shù)據(jù)的邏輯劃分,用于映射操作。




 

預(yù)約申請免費試聽課

填寫下面表單即可預(yù)約申請免費試聽!怕錢不夠?可先就業(yè)掙錢后再付學(xué)費! 怕學(xué)不會?助教全程陪讀,隨時解惑!擔心就業(yè)?一地學(xué)習(xí),可推薦就業(yè)!

?2007-2021/北京漫動者教育科技有限公司版權(quán)所有
備案號:京ICP備12034770號

?2007-2022/ m.lb577.com 北京漫動者數(shù)字科技有限公司 備案號: 京ICP備12034770號 監(jiān)督電話:010-53672995 郵箱:bjaaa@aaaedu.cc

京公網(wǎng)安備 11010802035704號

網(wǎng)站地圖