縱然很多機器學習 (Machine Learning, 簡稱 ML ) 演算法已存在超過十年,但想要簡單取得 ML / AI 程式庫或大型訓練資料集的時代才正要開始。自我和我的團隊從 2009 年起與客戶合作進行第一個 AI 開發項目,科技產業在人工智慧發展的漫漫長路上走了很久。遙想當年我們還只是一個不足十位成員的小型新創團隊,到現在踏入 2018 年,我的公司見證著有關 ML / AI 查詢的倍數增長。很明顯,取得程式庫的門檻正逐漸降低,給予創業型的獨立開發者更多時間去研究商業層面問題和如何創造支援 AI 的新產品。
開發 AI 的起點
回溯到 2009 年, Oursky 簽訂了第一張合作研發機器學習的合約:開發人物辨識系統來簡化身份驗證程序。我們利用神經網路 (Neural Networks)、決策樹 (Decision Tree)、某些 OCR 程式庫等多種元素進行實驗,最終取決於準確度而選用了神經網路作為解方。在那個年代,程式庫不一定包含演算法,所以那時候大部分演算法都是我們自己摸著石頭過河去執行的。
我們利用來實驗的機器學習技術由來已久,但整個科技產業其實相當侷限於當時的計算機資源。某些種類的機器學習(像 Convolutional Neural Networks 卷積神經網路,簡稱 CNN)在 80 年代就開始被應用。舉例來說,1998 年開發的 LeNet-5 協助一些銀行辨識支票上被數位化成 32 x 32 像素影像的手寫數字。如果需要執行更複雜的辨識任務就會需要更多卷積層(還有更強大的計算機運算能力),所以理所當然這種技術會被當時的最高處理效能所限制。
而在過去的幾年間,AI 的發展生態已煥然一新。硬體升級趕上了時代發展,GPU 變成了普及的商品,也開放了更多投資和商業化的機會。
人工智慧為何現在會席捲全球?
如果以具體化的數字去預測 AI 的發展潛力,單是人工智慧和機器學習這兩大主題,就已佔據了 2017 年整體投資在大數據應用的所有份額。根據 Financier Worldwide 的預測,投資金額在 2025 年將會高達 370 億美元,而中國則已經成為僅次於美國的全球第二大 AI 生態圈。
AI 正席捲全球,是因為科技生態圈已準備就緒:
- 市場上提供了像微軟的 CNTK、Theano、Google TensorFlow 這類型的開源機器學習程式庫
- 提升了計算機處理能力(處理器、GPU、將來的TPU)有利 AI 商業化
- 分散式 / 雲端基礎建設已普及到被使用來儲存海量商業資料(具有訓練模型的潛力)
時至今日,小團隊甚至自由接案的開發者都可以利用上述的程式庫為應用程式添加 AI 功能,比起以前土法煉鋼方便很多。譬如我們曾進行其中一個業餘項目是利用論壇數據來訓練一個 sequence-to-sequence 的粵語聊天機器人。此外,開發者可以利用預先訓練的模型(例如 Keras.io 的 CNN 程式庫)來省去從零開始訓練每個模型的運算成本。針對一些常見的任務,你甚至可以利用一些免費或價格低廉的 API 或程式庫來執行,比如說我們就曾經在沒有為機器學習特別編寫什麼 code 的情況下,為我們的客戶 CheckCheckCin 整合臉部辨識功能到 iOS 和 Android API。
對比 5 年前和今天,客戶接觸 AI 的態度大不同
回想十年前我們最初的起點,勇於嘗試 AI 科技的客戶屈指可數。這些客戶通常目標非常明確(已經有一些特別想要利用 AI 解決的問題),比如說從音樂檔案中產生和弦,或者辨識不同拉鍊的影像然後跟數據庫裡的庫存進行配對。對比這些日子以來,Oursky 不斷接到來自科技界或商界的大企業查詢有關 AI 的應用,而他們心中其實並沒有一個明確的藍圖想要如何應用人工智慧在他們現有的應用程式或業務運作上。
很多人大概了解人工智慧可以做什麼,卻很少人有「如何把 AI 應用到自己的業務上」這樣的概念。有別於商業諮詢,Oursky 定位在評估和建議 AI 解決方案,對客戶而言是否在長遠的營運上更合乎成本效益。舉例來說,經營者可以發想 AI 能在哪些目標範圍應用,幫助內部業務運作(例如數據分類或偵測詐騙)或提高客戶在前線的參與度(例如實時配對商品和商品照片)。
開發者應善用 AI 新程式庫,發想更多商業點子
另一方面,10 年前大家也還沒完全了解神經網路的應用可以延伸到什麼程度,但業界對於機器學習的研究至今仍在持續進行中並取得眾多突破。 其中一個例子是生成對抗網路 (Generative Adversarial Network),它能產生優良的視覺影像,而現在的應用已擴展至建立 3D 模型和金融科技,將來的發展更是無可限量。遷移學習 (Transfer Learning) 則是將預先訓練的 AI 模型套用到新的情境中,減輕了範本數量的需求,在我看來是這個範疇裡最令人振奮的發展,現在已經更廣泛地應用在各種應用程式之上(例如 Google AutoML)。
兼容常見應用程式的 AI 相關產品(像是 API 和程式庫等等)越來越多,開發者不再需要為某一個特定目的去重新訓練一個神經網路。舉一個例子,我們曾經幫客戶編寫過一個應用程式去紀錄他們團隊成員的情緒波動,或利用一些公開、可靠的 API 和預先訓練的神經網路來辨識影像裡的物件。去年聖誕我們公司舉辦了駭客松,兩名同事利用開源程式庫,在兩天內就完成以人臉辨識解鎖我們公司的物聯網(IoT)大門的測試,可見 ML / AI 已不再是遙不可及的開發夢想。
商業應用的第一步:先了解目前存在的 AI 種類
在思考人工智慧的應用方式以前,了解 AI 的各種組成元素是至關重要的。比方說,能提供優良服務的虛擬助手就需要好幾種不同的人工智慧元件,包括把聲音轉換成文字訊息、利用自然語言處理技術(Natural Language Processing,簡稱 NLP)去處理文字訊息、按指示執行指令動作、還有把文字訊息再次轉換成聲音。透過 Machine Learning,它甚至可以包含預測能力。
很多 AI 元件已經被廣泛使用作商業用途。社交媒體平台上投放的針對性廣告、Amazon 上展示的賣家物品和價格推薦、Snapchat 和 Instagram 上的動態貼圖等等全都是 AI 的應用範例。令人興奮的發展延伸到利用神經網路的情緒進行演算法交易、由騰訊支持的體素科技所使用的醫學影像技術、工業用的機器人、百度的阿波羅無人駕駛計劃、或新加坡各大銀行使用的聊天機器人等等。
現在,你不再需要先配備一整個工程師團隊才能開始研究 Machine Learning。任何一位開發者只要找到一位曾經浸淫在 AI 領域的夥伴,就可以利用開源程式庫來創造新產品和開始各種實驗(這個當然,我們一直都積極鼓勵開源!)。我和我的團隊都非常期待,能夠看到更多 AI 領域的新秀冒起,和全球 ML / AI 開發社群一起工作與成長。
如果你也想跟我們分享開源的程式庫,在 Twitter 上 ping Oursky 吧!
Oursky 致力幫助品牌與企業家實現他們的點子。如果你正在尋找合作夥伴一起建立下一個自家產品,來跟我們聊聊吧!
原文:AI isn’t new, but indie developers can create AI-powered products now” rel=”noopener” target=”_blank”>AI isn’t new, but indie developers can create AI-powered products now
作者:Ben Cheng
翻譯者:Queenie So