數(shù)據(jù)科學(xué)已經(jīng)徹底改變了企業(yè)AI,如果提供有價(jià)值的見解,以做出數(shù)據(jù)驅(qū)動(dòng)的決策,那么數(shù)據(jù)科學(xué)有很大的升級(jí)潛力。
每天,全球各地的組織都在尋找2.5萬(wàn)億字節(jié)的數(shù)據(jù),以獲得對(duì)其業(yè)務(wù)的見解和價(jià)值驅(qū)動(dòng)的行動(dòng)。為了實(shí)現(xiàn)這一目標(biāo),需要高技能的科學(xué)專家或數(shù)據(jù)科學(xué)家參與開發(fā)業(yè)務(wù)中的企業(yè)AI。在不斷增長(zhǎng)的業(yè)務(wù)領(lǐng)域中,數(shù)據(jù)科學(xué)家的每一個(gè)行動(dòng)都有助于改進(jìn)業(yè)務(wù)的功能。
所有的職業(yè)都會(huì)遇到一定的障礙或挑戰(zhàn),數(shù)據(jù)科學(xué)家的角色也不例外。許多企業(yè)未能充分利用數(shù)據(jù)科學(xué)家,將其置于錯(cuò)誤的角色或不提供必要的要求。根據(jù)LinkedIn,當(dāng)今數(shù)據(jù)科學(xué)家的十大技能包括機(jī)器學(xué)習(xí)、大數(shù)據(jù)、數(shù)據(jù)科學(xué)、R、Python、數(shù)據(jù)挖掘、數(shù)據(jù)分析、SQL、MatLab和統(tǒng)計(jì)建模。大多數(shù)數(shù)據(jù)科學(xué)家都可以在他們的電腦中運(yùn)用這些技能;然而,這些技能還不足以讓他們擔(dān)任正確的角色以實(shí)現(xiàn)最佳的業(yè)務(wù)增長(zhǎng)。
下面來探討一下,當(dāng)今數(shù)據(jù)科學(xué)家面臨的共同挑戰(zhàn)。
1、為智能企業(yè)AI準(zhǔn)備數(shù)據(jù)
數(shù)據(jù)科學(xué)家最重要的功能是識(shí)別和準(zhǔn)備正確的數(shù)據(jù)。根據(jù)CrowdFlower的一項(xiàng)調(diào)查,近80%的數(shù)據(jù)科學(xué)家每天都在清理、組織、挖掘和收集來自不同數(shù)據(jù)集的數(shù)據(jù)。在這里,對(duì)數(shù)據(jù)進(jìn)行徹底檢查,然后對(duì)其進(jìn)行分析和進(jìn)一步工作。這是一個(gè)非常艱苦的過程,76%的數(shù)據(jù)科學(xué)家認(rèn)為這是他們工作中最糟糕的部分之一。數(shù)據(jù)之爭(zhēng)要求數(shù)據(jù)科學(xué)家在維護(hù)日志以防止系統(tǒng)中的數(shù)據(jù)重復(fù)的同時(shí),在不同的平臺(tái)上以不同的格式和代碼精簡(jiǎn)TB級(jí)數(shù)據(jù)。
克服這一問題的最佳方法是采用基于人工智能的技術(shù),讓數(shù)據(jù)科學(xué)家在其功能上保持敏銳和更強(qiáng)大。增強(qiáng)學(xué)習(xí)是另一種多功能的企業(yè)AI工具,可以幫助和協(xié)助數(shù)據(jù)準(zhǔn)備,并提供對(duì)手頭問題的見解。
2、從多個(gè)來源生成數(shù)據(jù)
組織以各種格式從不同的應(yīng)用程序、軟件和工具獲取數(shù)據(jù)。對(duì)于數(shù)據(jù)科學(xué)家來說,處理大量數(shù)據(jù)是一個(gè)巨大的挑戰(zhàn)。這個(gè)過程需要手動(dòng)輸入和編譯數(shù)據(jù),這非常耗時(shí),并且可能導(dǎo)致重復(fù)或錯(cuò)誤的決策。當(dāng)數(shù)據(jù)被適當(dāng)?shù)赜糜谄髽I(yè)AI的最佳功能時(shí),它可能是最有用的。
企業(yè)可以建立具有集中平臺(tái)的智能虛擬數(shù)據(jù)倉(cāng)庫(kù),將所有數(shù)據(jù)源集成到一個(gè)地方。可以對(duì)來自中央存儲(chǔ)庫(kù)的數(shù)據(jù)進(jìn)行控制或加重處理,以滿足和提高企業(yè)的效率。這個(gè)簡(jiǎn)單的修復(fù)方法可以有效地節(jié)省數(shù)據(jù)科學(xué)家所需要的寶貴時(shí)間和精力。
3、識(shí)別業(yè)務(wù)問題
問題識(shí)別是穩(wěn)定運(yùn)行的一個(gè)重要方面。在構(gòu)建數(shù)據(jù)集和分析數(shù)據(jù)之前,數(shù)據(jù)科學(xué)家應(yīng)專注于識(shí)別與企業(yè)運(yùn)營(yíng)相關(guān)的關(guān)鍵問題。在設(shè)置數(shù)據(jù)集之前,有必要找到問題的根源,而不是跳到機(jī)械的方法。
數(shù)據(jù)科學(xué)家可以在啟動(dòng)任何分析過程之前維護(hù)受監(jiān)管的工作流程。工作流程必須考慮到所有業(yè)務(wù)利益相關(guān)者和關(guān)鍵方。特殊的儀表板軟件提供了一系列可視化小部件,可用于使數(shù)據(jù)對(duì)企業(yè)更有意義。
4、將結(jié)果傳達(dá)給非技術(shù)利益相關(guān)者
數(shù)據(jù)科學(xué)家的角色與業(yè)務(wù)策略相一致,他們的基本目標(biāo)是改善組織中的決策。數(shù)據(jù)科學(xué)家面臨的最大挑戰(zhàn)是與企業(yè)高管溝通他們的結(jié)果或分析。大多數(shù)管理者或利益相關(guān)者都不了解數(shù)據(jù)科學(xué)家使用的工具和設(shè)備,因此,為了通過企業(yè)AI實(shí)現(xiàn)模型,向他們提供正確的基本理念至關(guān)重要。
數(shù)據(jù)科學(xué)家需要采用一些概念,比如數(shù)據(jù)講故事,為他們對(duì)概念的分析和可視化提供強(qiáng)有力的敘述。
5、數(shù)據(jù)安全
快速升級(jí)使組織轉(zhuǎn)向云管理來存儲(chǔ)其重要數(shù)據(jù)。云存儲(chǔ)受到網(wǎng)絡(luò)攻擊和在線欺騙的威脅,使機(jī)密數(shù)據(jù)容易受到外界的攻擊。為了防止這些網(wǎng)絡(luò)攻擊,已經(jīng)實(shí)施了嚴(yán)格的法規(guī)來保護(hù)中央存儲(chǔ)庫(kù)中的數(shù)據(jù)。新的指導(dǎo)方針迫使數(shù)據(jù)科學(xué)家繞開這些新規(guī)定,使他們的工作變得更加復(fù)雜。
為了克服對(duì)安全的威脅,組織必須安裝高級(jí)加密和機(jī)器學(xué)習(xí)安全系統(tǒng)來保護(hù)數(shù)據(jù)。這些系統(tǒng)必須遵守所有安全規(guī)范,旨在避免耗時(shí)的審計(jì),以提高運(yùn)營(yíng)效率。
6、高效協(xié)作
數(shù)據(jù)科學(xué)家通常與數(shù)據(jù)工程師一起為組織開展相同的項(xiàng)目。那么良好的溝通渠道是必不可少的,以消除任何沖突。組織機(jī)構(gòu)應(yīng)采取措施建立良好的溝通渠道,以確保雙方團(tuán)隊(duì)的工作流程匹配。企業(yè)還可以設(shè)立一名首席執(zhí)行官來監(jiān)督兩個(gè)部門是否在同一條線上工作。
7、非特定KPI指標(biāo)的選擇
有一種誤解,認(rèn)為數(shù)據(jù)科學(xué)家可以獨(dú)自完成大部分工作,并為組織面臨的所有問題提供現(xiàn)成的解決方案。這給數(shù)據(jù)科學(xué)家?guī)砹司薮蟮膲毫?,也降低了其的工作效率?/p>
對(duì)于每個(gè)組織來說,有一套確定的指標(biāo)來衡量數(shù)據(jù)科學(xué)家提出的分析是至關(guān)重要的。此外,他們必須檢查這些指標(biāo)對(duì)業(yè)務(wù)運(yùn)作的影響。
數(shù)據(jù)科學(xué)家的工作是一項(xiàng)具有挑戰(zhàn)性的工作,因?yàn)橛懈鞣N的任務(wù)和要求。然而,其是當(dāng)今市場(chǎng)上需求量最大的工作之一。數(shù)據(jù)科學(xué)家面臨的問題可以輕松地減少,以提高企業(yè)AI在苛刻的工作環(huán)境中的生產(chǎn)力和功能。
關(guān)鍵詞: 數(shù)據(jù)科學(xué)家 為智能企業(yè)AI準(zhǔn)備數(shù)據(jù) 從多個(gè)來源生成數(shù)據(jù) 非特定KPI指標(biāo)的選擇
網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 m.netfop.cn All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com