可解釋人工智慧

可解釋人工智慧（英語：，縮寫為XAI）指的是讓專家能夠理解人工智慧之成果的方法與技術。它相對於黑箱式的機器學習，因為黑箱式的機器學習的設計者本身也無法解釋為什麼人工智慧能達到某些成果[1]。可解釋人工智慧被認為是「要求解釋的權利」（right to explanation）的一種實踐[2]。

要求人工智慧解釋它的決定是一種翻譯的問題（interpretability problem）[3]。人工智慧的優化行為是一種為了滿足數理上特定目標的行為。其目標由設計者規劃，比如一個設計者要求「在資料集裡面精準分析電影如何被正面評價」。此時，人工智慧可能會找到一些通則，像是「評價中包含『爛』這個字眼表示是負面評價」。或是可能找到一些不正確的規則，比如「評價中包含『李小龍』這個字眼表示是正面評價」；這些規則可能難以解釋，甚至很可能在其他資料集得到錯誤的判斷，比如你很可能無法在《教父》的電影評價裡看到「李小龍」的字眼，但這不表示它是部爛片。針對這類問題，人類就能透過可解釋人工智慧的技術來監督人工智慧系統所找到的規則，並且判斷這些規則在真實的世界裡是否適用[3]。

目的

在代理人之間的合作上（這裡的代理人指的是演算法與人），信任是至關重要的事。如果人們要接受演算法的判斷就必須得先相信演算法。信任標的之不完整會成為方法優化的障礙。因此，翻譯（interpretability）與解釋（explainability）是達成其他標的之前的一個中程標的[4]。

人工智慧有時會學到一些無法解釋的技巧，在用來訓練的資料上做到一些最佳的結果，滿足明確設定的目標；但是，有時候它卻沒有滿足人類設計者所隱含的需求。比如在2017年的實驗裡，有一個圖像識別的人工智慧在辨識馬的照片時作了弊。實驗結果裡有一組人工智慧系統確實辨識出了馬的特徵，比如長型的臉，細長的四條腿之類的；但是有另一組系統則依據圖片左下角是否有「Copyright」的標記來判斷那是不是一張馬的照片，這個結果達到的準確性是因為許多實驗用的照片來自馬術協會，而協會在照片上打入了版權（Copyright）宣告的字樣[1]。2017年的另一個系統裡，被訓練在虛擬世界中抓取物品的人工智慧學會了通過將操縱器放置在目標和監督者之間的方式來作弊，以便讓監督者誤以為它抓到了目標[5][6]。

美國國防部國防高等研究計劃署亦進行了可解釋人工智慧的專案。目標是建立「玻璃盒」（glass box）模型，除了可解釋性外，更要求人們始終都能監管機器的行為（human-in-the-loop），並且不會大幅度的犧牲人工智慧的運算效能。人類使用者能即時或是事後理解人工智慧的認知是什麼，並且能決定何時信任人工智慧，又何時不信任人工智慧[7][8]。其他的可解釋人工智慧應用則著重於從黑盒子的模型裡面抽取出知識，或是讓不同的模型之間能進行比對[9]。「玻璃盒」一詞亦被用來表示那種輸入與輸出受到監控的人工智慧系統。為的是確保系統遵守道德與社會法律的價值，並且提出以價值為基礎的解釋。另外，這一詞也被用在智慧型個人助理說明反事實陳述時的解釋[10]。

監管法令

以各國的監管單位的角度來看，官方機構與一般使用者對人工智慧的應用來說，必需清楚的為它的決策過程定義究責的規則，以確保其可信任性與透明度。這部份的需求受到愈來愈多的重視，並開始有全球性會議中討論這個新興科技，像是2017年的國際人工智慧聯合會議（International Joint Conference on Artificial Intelligence）中就有針對可解釋人工智慧的研討會[11]。

在2018年修定的歐盟一般資料保護規範（GDPR）裡宣佈了「要求解釋的權力」，希望以此來解決這些愈來愈受重視的演算法可能帶來的問題。然而，GDPR只要求局部的解釋。而在美國，保險公司甚至被要求解釋他們的費率與決策之間的關係[12]。

參考文獻

Sample, Ian. . 衛報. 5 November 2017 [30 January 2018]. （原始内容存档于2020-11-09）（英语）.
Edwards, Lilian; Veale, Michael. . Duke Law and Technology Review. 2017, 16: 18. SSRN 2972855 .
. Science. 5 July 2017 [30 January 2018]. （原始内容存档于2020-11-26）（英语）.
Dosilovic, Filip; Brcic, Mario; Hlupic, Nikica. (PDF). . MIPRO 2018. Opatija, Croatia: 210–215. 2018-05-25 [2020-03-24]. doi:10.23919/MIPRO.2018.8400040. （原始内容 (PDF)存档于2018-12-10）.
. Bloomberg.com. 11 December 2017 [30 January 2018]. （原始内容存档于2018-01-08）（英语）.
. OpenAI Blog. 13 June 2017 [30 January 2018]. （原始内容存档于2019-01-30）.
. DARPA. DARPA. [17 July 2017]. （原始内容存档于2021-02-19）.
Holzinger, Andreas; Plass, Markus; Holzinger, Katharina; Crisan, Gloria Cerasela; Pintea, Camelia-M.; Palade, Vasile. . 2017-08-03. arXiv:1708.01104  [cs.AI].
Biecek, Przemyslaw. . Journal of Machine Learning Research. 23 June 2018, 19: 1–5. Bibcode:2018arXiv180608915B. arXiv:1806.08915 .
Sokol, Kacper; Flach, Peter. . . 2018: 5868–5870. ISBN 9780999241127. doi:10.24963/ijcai.2018/865.
(PDF). Earthlink. IJCAI. [17 July 2017]. （原始内容 (PDF)存档于2019-04-04）.
Kahn, Jeremy. . Bloomberg Businessweek. 12 December 2018 [17 December 2018]. （原始内容存档于2020-07-25）.

外部連結

. [2020-03-24]. （原始内容存档于2020-03-24）.
.
. [2020-03-24]. （原始内容存档于2020-01-07）.
. [2020-03-24]. （原始内容存档于2021-02-24）.
. Computerworld. 2017-11-02 [2017-11-02]. （原始内容存档于2020-10-22）.
Park, Dong Huk; Hendricks, Lisa Anne; Akata, Zeynep; Schiele, Bernt; Darrell, Trevor; Rohrbach, Marcus. . 2016-12-14. arXiv:1612.04757  [cs.CV].
. Explainable AI: Making machines understandable for humans. [2017-11-02]. （原始内容存档于2021-02-04）.
. Parallel Forall. 2016-08-17 [2017-11-02]. （原始内容存档于2017-11-07）.
. Parallel Forall. 2017-05-23 [2017-11-02]. （原始内容存档于2017-11-07）.
Knight, Will. . MIT Technology Review. 2017-03-14 [2017-11-02]. （原始内容存档于2019-11-04）.
Alvarez-Melis, David; Jaakkola, Tommi S. . 2017-07-06. arXiv:1707.01943  [cs.LG].
. simMachines. 2017-10-12 [2018-02-02]. （原始内容存档于2020-11-28）.
Bojarski, Mariusz; Yeres, Philip; Choromanska, Anna; Choromanski, Krzysztof; Firner, Bernhard; Jackel, Lawrence; Muller, Urs. . 2017-04-25. arXiv:1704.07911  [cs.CV].

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[guardian-1] Sample, Ian. . 衛報. 5 November 2017 [30 January 2018]. （原始内容存档于2020-11-09）（英语）.

[:0-2] Edwards, Lilian; Veale, Michael. . Duke Law and Technology Review. 2017, 16: 18. SSRN 2972855 .

[science-3] . Science. 5 July 2017 [30 January 2018]. （原始内容存档于2020-11-26）（英语）.

[dosilovic2018-4] Dosilovic, Filip; Brcic, Mario; Hlupic, Nikica. (PDF). . MIPRO 2018. Opatija, Croatia: 210–215. 2018-05-25 [2020-03-24]. doi:10.23919/MIPRO.2018.8400040. （原始内容 (PDF)存档于2018-12-10）.

[5] . Bloomberg.com. 11 December 2017 [30 January 2018]. （原始内容存档于2018-01-08）（英语）.

[6] . OpenAI Blog. 13 June 2017 [30 January 2018]. （原始内容存档于2019-01-30）.

[7] . DARPA. DARPA. [17 July 2017]. （原始内容存档于2021-02-19）.

[8] Holzinger, Andreas; Plass, Markus; Holzinger, Katharina; Crisan, Gloria Cerasela; Pintea, Camelia-M.; Palade, Vasile. . 2017-08-03. arXiv:1708.01104  [cs.AI].

[9] Biecek, Przemyslaw. . Journal of Machine Learning Research. 23 June 2018, 19: 1–5. Bibcode:2018arXiv180608915B. arXiv:1806.08915 .

[SokolFlach2018-10] Sokol, Kacper; Flach, Peter. . . 2018: 5868–5870. ISBN 9780999241127. doi:10.24963/ijcai.2018/865.

[11] (PDF). Earthlink. IJCAI. [17 July 2017]. （原始内容 (PDF)存档于2019-04-04）.

[12] Kahn, Jeremy. . Bloomberg Businessweek. 12 December 2018 [17 December 2018]. （原始内容存档于2020-07-25）.

人工智能系列内容

主要目标知识表示自动规划机器学习語言處理电脑视觉机器人学強人工智慧弱人工智慧生成式人工智慧
实现方式符号人工智能深度学习貝氏網路进化算法混合智能系統
人工智能哲學伦理人工智能安全幻觉存在风险图灵测试中文房间可解釋人工智慧友好的人工智能人工智能监管
历史时间轴发展人工智慧低谷人工智能热潮
技术应用项目编程语言
术语术语