【專欄】淺談建立成功AI的基本技巧

民報新聞

2020年3月18日下午10:46·7 分鐘 (閱讀時間)

一個人工智慧化是21世紀最顯著的突破之一。來自不同行業的專家研究其功能並發現其新的應用方式。我們將人工智慧（AI）稱為新興技術，這是自1950年代以來，科學家一直在朝著這個努力的方向。

最初，人工智慧遠非我們在科幻電影中看到的智能機器人。儘管如此，由於機器學習和深度學習等技術，人工智慧已成為資訊技術（Information Technology， IT）行業最有前途的領域之一。對AI開發人員的需求不斷增長，一些專家認為電腦取代人類的未來。儘管現在說人工智慧對勞動力構成威脅還為時過早，但現代工人肯定會從對這項技術更多了解中受益，因為它可以使他們為未來的行業變化，做準備並熟悉新技術，且是有效而有趣的工具。

人工智慧以多種不同方式進入我們的生活。例如，我們使用Amazon Echo，Google Assistant或Siri之類的助手。對人工智慧的理解帶來了很多機會。掌握該技術的基礎知識，足以了解簡單工具的工作原理。隨著對AI的更多了解，你將有機會成為一名開發人員，將創建先進的AI應用程序。這個領域有無限的可能性。如果你想使用人機界面，神經網絡和量子人工智慧，那麼學習AI對於軟體工程職業來說，是必不可少的。

如果你剛開始使用自己的AI，這裡有一些專家提示。在構建可積極改變，你組織AI時，請考慮以下七個基本技巧。

1.明確定義AI項目的目的

如果你不能用一句話概括AI的最終目標，那還不夠清楚。找出目標客戶並定義什麼使AI獨樹一幟是關鍵問題，這些問題將推動你的方法並增加成功的機會。

了解你的客戶在這裡，你問誰能從你的AI解決方案中受益？你能為他們解決什麼問題？要準確了解他們的需求。如果沒有真正的需求，就不會有採用和投資回報率。

衡量你的能力在這裡，你可以真正充實解決方案涉及的內容以及實現該解決方案所需的內容（數據，知識，技術等）。這樣做可以使你清楚地了解需求是否符合你的能力和技術。

評估你的競爭解決方案的最終目標是成為現有解決方案的更好替代方案。這意味著你的AI項目必須比現有解決方案更進一步。那麼，什麼使你的項目與眾不同？

定義所需的質量你的AI需要達到多少才能被認為有用？現在是時候定義客戶需要的準確性級別以及實現它的步驟。你還應該考慮質量成果的回報矩陣，以便圍繞該矩陣調整優化。

2.遵循公認的方法

人工智慧並不是你想隨手即興使用的東西。遵循經過實踐檢驗的方法論，可以確保你的數據科學項目可靠，成功。

最常見的方法是SEMMA和CRISP-DM。

塞瑪（SEMMA）

SEMMA代表Sample，Explore，Modify，Model和Assess。它指導了數據挖掘應用程序的實施。這是使用全面建模技術進行數據挖掘的迭代過程。儘管它被認為是標準方法，但它著重於過程而不是結果。SEMMA的階段和相關任務如下：

樣品（Sample）：該過程從數據採樣開始，例如，選擇要建模的數據集。數據集應足夠大以包含足以檢索的信息，但又應足夠小以有效使用。此階段還涉及數據分區。

探索（Explore）：該階段通過在數據可視化的幫助下發現變量之間以及異常之間的預期和意外關係來涵蓋對數據的理解。

修改（Modify）：Modify階段包含選擇，創建和轉換變量的方法，以準備進行數據建模。

型號（Model）：在模型階段，重點是對準備好的變量應用各種建模（數據挖掘）技術，以創建可能提供所需結果的模型。

評估（Assess）：最後一個階段是評估。對建模結果的評估顯示了所創建模型的可靠性和實用性。

SEMMA主要專注於數據挖掘項目的建模任務，而忽略了業務方面（與CRISP-DM及其業務理解階段不同）。

跨行業的數據挖掘標準流程（Cross-industry standard process for data mining，CRISP-DM）

與SEMMA不同，此方法包括「業務理解」階段，該階段從業務角度著眼於與數據挖掘定義相關的目標。

CRISP-DM將數據挖掘過程分為六個主要階段：業務理解；數據理解；資料準備；造型；評價；部署方式；階段的順序並不嚴格，並且總是需要在不同階段之間來回移動。

3.從可信來源查找數據

要創建AI，機器學習算法需要數據，這是沒有其他方法的。在繼續進行之前，你必須定義所需的數據量以及打算如何獲取它們。

當然，可以自行注釋訓練數據，但並不是每個人都有時間。

4.選擇用於機器學習的算法

現在有個大問題：你應該使用哪種機器學習算法？以下是一些有助於你縮小範圍的注意事項：

結果的準確性；訓練時間；使用線性；參數數量；功能數量。

可以使用的算法並不缺乏，但是你當然要選擇最適合你的項目的算法。你可能已經知道，大多數實際的機器學習都使用監督學習。監督機器學習算法的一些流行示例，包括用於回歸問題的線性回歸和用於分類問題的支持向量機。

對於計算機視覺算法，像卷積神經網絡（CNN）這樣的人工神經網絡更適合於圖像標注，注釋和分割的任務。而遞歸神經網絡（RNN）最適合語言分析。最後，多層感知器（MLP）是語音識別和機器翻譯的理想選擇。

5.設計和建構你的基礎架構

建立AI基礎設施是一項戰略決策，你必須考慮諸如數據存儲，計算資源，預算和時間之類的事情。英特爾撰寫的有用的教程系列，說明了你可以選擇的基礎架構：

內部硬体（本地）內部構建和維護自己的計算基礎架構需要大量的前期工作，但這也給你帶來更多的自由。借助本地基礎架構，你可以選擇要使用的圖形處理器（Graphics Processing Unit，GPU）。

雲端當你剛入門時，雲端平台提供商，例如Amazon Web Services（AWS），Google Cloud Platform（GCP）和Microsoft Azure，最有意義。你可以在高性能GPU上獲得第一個培訓模型，而與內部部署相比，前期投資更少，並且具有最新技術和自動維護的優勢。你還可以使用特定於機器語言（Machine Language，ML）的提供程序（例如Paperspace）來定制其基礎結構產品，以更好地支持深度學習工作流程。

6.測試和驗證模型

必須先對AI進行培訓，然後才能發揮作用。這意味著通過訓練數據集運行你的AI應用程序，以便它可以創建模型，然後在全新的集合上再次運行它以測試結果的準確性。

老實說，培訓可能比實際開發花費更多的時間，但這可能是你AI策略中最重要的一步。經過培訓和測試的模型是有用的模型。

7.不斷監視和重新訓練你的模型

一旦你擁有一個經過最終訓練和驗證的模型，便可能會後退並開始一天的嘗試。但是你的模型監視的現實是動態的，這意味著你的模型也應該是動態的。專家指出：“業務條件變化，客戶變化，產品變化，環境變化都會影響你的應用程序。即使你可能沒有注意到，它的性能也會隨著時間的推移逐漸降低。如果你正在計劃一個AI項目，則需要考慮再培訓。”

8.建立你的產品

請記住，好的產品可以解決現實世界中的問題。

雖然這並非是針對你的項目的最佳AI策略的全面指南，但對於確保AI步入正確道路，這是一個堅實的開端。專欄屬作者個人意見，文責歸屬作者，本報提供意見交流平台，不代表本報立場。

新聞專題
主打AI科技！2024上半年話題新機亮相

EBC東森新聞·8 小時前
凶手抓到了！藥單上印「媽媽是婊子」動機曝光
凶手抓到了！藥單上印「媽媽是婊子」動機曝光
Reactions130
三立新聞網 setn.com·3 小時前
只剩你還在台灣？陶晶瑩曬桃機驚人「逃難潮畫面」　網友全看傻了
記者鍾智凱／綜合報導陶晶瑩把兒女送出國，近來她飛兒子小龍念書所在的新加坡，今曬出桃園機場畫面，只見查驗區非常多人，滿滿的人龍，讓網友看了相當驚奇，直呼：「現在是剩下
Reactions65
Yahoo奇摩新聞（記者簡子喬）·11 小時前
鄭靚歆辦同志婚禮淚娶德裔老婆！辣媽胡文英穿「全透視比基尼」驚呆全場
前《我愛黑澀會》美眉鄭靚歆，26日與大5歲的德裔老婆鄭采熙（Aky）舉辦同志婚禮。特別的是，鄭靚歆的美魔女辣媽胡文英，以透視藍色比基尼打扮現身，相當搶鏡。
Reactions154
TVBS新聞網·1 天前
根本用灌的！明起暴雨狂襲全台　2地區「雨勢更猛更持久」
今日（25日），受鋒面影響，全台大暴雨！南部地區更是雨水豐沛，根據中央氣象署資料，截至25日下午16時26分，全台前5名累積雨量分別為高雄燈塔135毫米、新興133毫米、鼓山131.5毫米、前鎮121毫米、苓雅119.5毫米，全部都在高雄市。氣象署也預估未來一週預計有兩波鋒面陸續影響臺灣，天氣相當不穩定。
Reactions23
TVBS新聞網·10 小時前
女兒婚禮58歲美魔女連換3套　驚見「統促黨」張安樂也來！親密關係曝光
58歲資深女星胡文英，女兒鄭靚歆與老婆Aky今（26）日大喜之日，在台北信義區補辦婚宴。她連換3套禮服，成為全場焦點；婚宴上也驚見「統一促進黨」主席白狼張安樂，胡文英親揭二人親密關係！
Reactions90
引新聞·1 天前
妙齡女「頭套塑膠袋」陳屍條通大樓　母崩潰認屍、發現七字遺書
（記者劉雅文／綜合報導）台北市中山區條通大樓驚傳命案！一名25歲的曾姓女子，住在條通大樓內，經家人報案後由警方 […]
Reactions173
中時新聞網·2 天前
很像梅雨的春雨要來了！專家：更強更廣這2天達高峰
另一波鋒面今天接近，天氣不穩定，氣象粉專「觀氣象看天氣」表示，這波降雨範圍更廣、強度更強，很像梅雨的春雨要來了，明後天將達降雨高峰。前氣象局長鄭明典也表示，最近有點梅雨的味道。
Reactions7
中天新聞網·6 小時前
有借沒還！桃猿循環杯去年逾1萬個一去不復返　今年大改版增加辨識度
桃園市政府與樂天球團攜手推動環境友善球場，去年63場主場賽事推動使用循環杯達6萬杯。今年度搭配循環杯樣式改版，增加循環杯辨識度，號召場內攤商一同響應。
Reactions12
TVBS新聞網·4 小時前
向太浴室重摔！被推進開刀房「手術5.5小時」　最新傷勢曝光
香港影劇大亨向華強妻子向太（陳嵐），今（2024）年已65歲，平常熱愛透過社群平台分享日常生活，偶爾也會與兒媳郭碧婷同框，兩人良好關係宛如親生母女。怎料，向太日前卻傳出在浴室摔倒消息，崩潰表示，「我明明很善良，可世間疾苦一樣都沒放過我」，最新傷勢隨之曝光。
Reactions17
三立新聞網 setn.com·8 小時前
七寶媽靠業配賺翻了！64家合作廠商全被挖　跟她切割「僅10家」
記者趙浩雲／台北報導網紅「林叨囡仔」（七寶媽）因為當眾在直播中歧視資源班的小孩，即使二度道歉仍被罵翻，而有網友整理出與她合作廠商清單，食衣住行育樂就有64家。七寶媽網紅24日在直播
Reactions78
三立新聞網 setn.com·9 小時前
突拋震撼彈！柯文哲脫口：2026選很差「2028收攤」　曝藍營2大總統人選
記者詹宜庭／台北報導民眾黨主席柯文哲挑戰總統大位失利後說好4年後要再拚一次，面對外界關注的2026九合一選舉及2028總統大選佈局，柯文哲今（26日）接受資深媒體人
Reactions124
TVBS新聞網·1 天前
《浪姐5》楊謹華爆紅！大批粉絲圍繞狂喊「媽咪」　震憾畫面曝光
46歲女星楊謹華登上大陸實境秀《乘風2024》（浪姐5），初舞台嗨唱張惠妹的〈一個人跳舞〉，唱跳實力獲得不少好評，她在大陸的人氣也因此水漲船高，近日網上瘋傳一段她收工的影片，粉絲等她到深夜，並狂喊楊謹華「媽咪」，釣出她本人搞笑回應。
Reactions16
三立新聞網 setn.com·2 天前
男友能力太強「像馬拉松」！她「從沒完整體驗」好崩潰：全身都快受不了
生活中心／梁雪婷報導情侶激戰的時間長短容易影響雙方的歡愉程度。近日，就有女網友抱怨，各方面都很好的男友，唯獨在性事上能力太強，讓她感覺像是馬拉松一樣，每次都很累。貼
Reactions27
Yahoo房地產特別企劃·2 天前
買房「跟著捷運走」就對了？他揭高雄人「1原因」不吃這套：當地人偏愛買這2種房
買房除了得投注大筆資金，更是一個影響生活品質的重大決策；其中，交通便利與否？是許多人看房的一大重點，跟著捷運站買房，更是不少人購屋的第一要件，尤其是出站就到家的捷運宅，不僅交通方便，保值抗跌性也十分優秀，自然周邊房價會來得貴一些。不過，有捷運的縣市真都是如此嗎？對此，有專家透露，高雄人並沒有「沿著捷運買房」的習慣，甚至還曾讓一票投資人南下掃貨最終慘賠收場，為什麼？
Reactions30
三立新聞網 setn.com·10 小時前
沈文程爆料張小燕做這件事！一輩子記心裡　首次上電視差點被看不起
記者鄭尹翔／台北報導雙金歌王沈文程（七海刀狼）大事近！將於五一勞動節重返台北TICC，盛大舉辦《國際沈文程日五月一日彼下暗》台北返場演唱會，說到人生首巡大型個唱，
Reactions37
民視·10 小時前
鋒面帶來「大補丸」！曾文水庫驚人進帳數字曝光
生活中心／李明融報導本週鋒面帶來豐沛水氣，間接為全台水庫吃下「大補丸」，截至今天（26日）早上，國內規模最大的曾文水庫集水區連日來累積降雨已破百毫米，累積降雨創下將近7個半月以來單日紀錄，預估補水510萬立方米，明顯有助於幫助水情。
Reactions19
TVBS新聞網·4 小時前
梅雨鋒面報到！雨彈還沒完　「這天起」雷雨炸全台
今（26日）鋒面接近，各地都有出現短暫陣雨或雷雨，中南部地區影響更大，高雄暴雨還出現災情，不過明（27日）開始，鋒面減弱，不過仍有降雨的機會，到了下週一（20日）降雨才會稍稍趨緩。
Reactions8
TVBS新聞網·1 小時前
昔主張廢黨政軍條款！NCC內定新主委傳「遭民進黨否決」
5月20日準總統賴清德將走馬上任，新內閣布局也在近期逐步揭曉，值得關注的是，國家通訊傳播委員會（NCC）將產生新人事，行政院依規要在4月底前提交新任委員名單送交立法院。但媒體報導，今（26）日民進黨內部無法產生共識，杯葛原內定的新任NCC主委人選；準副閣揆鄭麗君更退出提名工作，新內閣正重新展開人選諮詢作業。
Reactions9
Yahoo奇摩新聞（記者林政平）·6 小時前
田馥甄「挺過義大利麵事件」回歸中國大陸演出遭抵制！本人現身回應
田馥甄26日出席品牌活動，她即將於5月2日登上天津舉辦的「泡泡島音樂藝術節」，引發中國大陸網友的關注。當初她因為在2022年7月美國眾議院院長裴洛西訪台期間，於社群曬出一張吃義大利麵的日常生活照，結果被陸網友質疑她台獨，即使她將照片刪掉，還是抵擋不住抵制的聲浪。
Reactions17
Yahoo奇摩股市·6 小時前
85萬股東QQ！開發金現金股利每股發0.5元更名「凱基金控」
85萬股東QQ！開發金（2883）股利公布了，每股確定發現金股息0.5元，還低於之前網友認為「不及格的0.6元」，以今日收盤價13.45元計算，股息殖利率為3.7%，位於之前法人預估0.5~0.6元的下緣位置，。此外今日董事也通過正式更名「凱基金控」，代表中信集團第三代辜仲瑩時代的正式來臨。
Reactions21

相關內容

其他人也在看