音声認識についての世界ろう連盟と国際難聴者連盟の共同声明

2019年4月29日にWFD、IFHOHが電話リレーサービスの音声認識システムについて提言されました。


※原文(英語)は世界ろう連盟公式サイトに掲載されています。
※国際手話動画は世界ろう連盟の公式Vimeoチャンネルでご覧いただけます。
下記和訳をPDFでダウンロード

WFD and IFHOH

世界ろう連盟(WFD)と国際難聴者連盟(IFHOH)による共同声明
電話リレーサービスおよび字幕サービスにおける音声自動認識

国際手話はこちら

人工知能技術の進歩と共に、自動音声認識(ASR)の領域が著しい発展をみせている。結果として、自動音声認識(ASR)を利用するアプリケーションやAI技術の開発が増え、通信とアクセシビリティに有望な影響を及ぼしている。 しかし、この領域は新しく出現したばかりであり、世界ろう連盟(WFD)と国際難聴者連盟(IFHOH)で記録している自動音声認識(ASR)技術の利用体験と事例はまだ多くない。ろう者・難聴者が参画する研究開発に参画する取り組みを継続して、自動音声認識(ASR)技術の利用とアプリケーションを改善する必要がある。

本共同声明は、自動音声認識(ASR)が現在の通信方法、例えば電話リレーサービス(TRS)や字幕サービス等を置き換えるものではないことを通知する。

電話サービスは、人々の日常生活を支える重要な社会インフラの一部である。電話の音声を理解できないろう者・難聴者は、電話リレーサービス(TRS)と字幕により電話サービスにアクセスできるようになる。ろう者・難聴者の雇用機会と社会的統合の拡大のためには電話リレーサービス(TRS)が重要である。字幕による情報へのアクセスについても同じことが言える。

電話リレーサービス(TRS)および字幕への自動音声認識(ASR)の適用は、現時点では以下の理由により慎重に検討すべきである。

  1. 特定の地域における電話機の粗悪な音質、またノイズや不特定多数の話者などの劣悪な環境条件のために、電話サービス用の自動音声認識(ASR)が一貫して良好な認識精度を提供することは困難。
  2. 加えて、自動音声認識(ASR)システムに知られていない固有名詞や専門用語など、一部の単語の事前学習は難しく、常にいつでも信頼できる認識を保証することはまだ困難。

質の高い字幕サービスのおかげで、ろう者・難聴者は会議の会話に平等にアクセスできるようになり、ライブのニュース放送を支える重要かつ正確な情報も提供されている。

人間のオペレータを介せずに自動音声認識(ASR)サービスが利用することは、ろう者・難聴者の社会への完全参加より排除することになる。

電話リレーサービス(TRS)の重要性、特に緊急事態における電話リレーサービス(TRS)の利用を考慮すると、電話リレーサービス(TRS)の十分な信頼性とサービスの質は絶対不可欠である。

国連障害者権利条約第9条に「締約国は、障害者が他の者と対等に、 情報通信(情報通信機器及び情報通信システムを含む。) を利用する機会を有することを確保するための適当な措置をとる」ことが明記されている 。

ろう者・難聴者が全面的に利害関係をもつ自動音声認識(ASR)技術の適用に関し、その検討にろう・難聴の関係当事者が適切に参画することは必要なことである。

世界ろう連盟(WFD)と国際難聴者連盟(IFHOH)は、ろう者・難聴者を支援するための自動音声認識(ASR)の研究開発を歓迎し奨励するものではあるが、現段階では、人間のオペレータを自動音声認識(ASR)技術に置き換えるのは時期尚早であり、真に実用化されるまでにはさらなる研究開発が必要だと確信する。従って、人間を介した電話リレーサービス(TRS)と字幕を、何より優先することが勧告される。

電話リレーサービスがまだ公的制度化されていない国の政府は、公共電話リレーサービス(TRS)の導入を延期するための口実として、自動音声認識(ASR)の開発および導入を持ち出すべきではない。

将来は、自動音声認識(ASR)が改善されて人間のリレーオペレータや字幕入力者に取って代われるようになる可能性もあるが、そのためにはおそらく何年もかかる。また、自動音声認識(ASR)の正確さとサービス品質において高度の成功率を達成するという検証可能な証拠と、相当な利用者コミュニティの支持が要求される。

電話リレーサービス(TRS)は、速やかにオペレータベースの電話リレーサービスによる公共サービスとして実現されるべきである。

 詳しい情報:

世界ろう連盟(WFD)と国際難聴者連盟(IFHOH)は、国際電気通信連合(ITU)と協力して、自動音声認識(ASR)のガイドラインとともに、テキストリレー、ビデオリレー、字幕付き電話リレーを含むさまざまなリレーサービスの主要性能評価指標(KPI)の測定基準を検討している。 この共同作業の成果として、電話リレーサービス(TRS)サービスの品質要件の明確化が期待される。電話リレーサービス(TRS)で利用されるすべての自動音声認識(ASR)技術はこの要件を満たすことが要求される。

要件が明確に設定され、自動音声認識(ASR)技術がこれらの要件を十分に満たすほどに向上するまで、実際の電話リレーサービス(TRS)および公共のイベントやサービスにおいて、人間の代替手段としての自動音声認識(ASR)技術の利用を検討すべきではない。

自動音声認識(ASR)技術を利用する提案が日本によって発表された。 ITU-D寄稿文書「障害者およびその他の特定のニーズを持つ人による電気通信/ ICTサービスへのアクセス」(SG1RGQ / 78-E 、2018年9月3日発行):http://www.itu.int/net4/ITU-D/CDS/sg/rgqlist.asp?lg=1&sp=2018&rgq=D18-SG01-RGQ07.1&stg=1

オーストラリア、スイス、アメリカ、および欧州の数か国にも同様の動きがある。

電話リレーサービス(TRS)へのAI技術、特に自動音声認識(ASR)の無批判的かつ性急な適用について、世界ろう連盟(WFD)と国際難聴者連盟(IFHOH)はろう者・難聴者の生命と権利を守るという観点から、共同で懸念を表明する。手話言語が第一言語であるろう者にとって、ビデオリレーサービスは絶対に必要であり、自動音声認識による代替手段は提供できないことが理解されなければならない。

また、自動認識の利用や手話言語の生成に関して、現時点では実用的なシステムやサービスはまったく存在せず、また、これらが近い将来、人間の手話オペレータに取って代わると期待するのは現実的ではない。このことは、世界ろう連盟(WFD)と 世界手話言語通訳者協会の共同声明 手話アバターの利用に関する声明 : http://wfdeaf.org/news/resources/wfd-wasli-statement-use-signing-avatars/ において指摘した通りである。

世界ろう連盟について
世界ろう連盟(WFD)は、世界中で約7000万人のろう者の人権を代表し推進する国際的な非政府組織です。世界ろう連盟(WFD)は121カ国にあるろう者協会の連合体です。ろう者の人権と、自己決定、手話言語、教育、雇用、そして地域社会生活を含む生活のあらゆる範囲への完全かつ高質の、平等なアクセスを促進することを使命としています。世界ろう連盟(WFD)は国連で諮問の地位を有する、国際障害者同盟(IDA)の創設メンバーです。(www.wfdeaf.org) Email: info@wfd.fi

国際難聴者連盟について
国際難聴者連盟(IFHOH)は、ドイツで登録された国際的な非政府組織であり、世界の大部分の地域に40以上の全国会員組織を持ちます。 国際難聴者連盟(IFHOH)と欧州難聴者連盟(EFHOH)は、難聴者問題の理解促進と難聴者のアクセス向上のために活動しています。 国際難聴者連盟(IFHOH)は、国連経済社会理事会(ECOSOC)の特別諮問地位、世界保健機関(WHO)との提携、および国際障害同盟(IDA)の会員権を持っています。 (www.ifhoh.org) Eメール: info@ifhoh.org

※原文(英語)は世界ろう連盟公式サイトに掲載されています。
※国際手話動画は世界ろう連盟の公式Vimeoチャンネルでご覧いただけます。
上記和訳をPDFでダウンロード

カテゴリー: お知らせ パーマリンク