清华大学金融科技研究院孵化
金融科技与金融创新全媒体

扫描分享

本文共字,预计阅读时间

科技发展,对于视障者有多大的帮助?

已逝世的霍金曾经说过一句话,“医药没有治愈我的疾病,所以我更依赖于科技。”对于视觉障碍者而言,在智能手机和互联网服务不发达的时候,他们的生活几乎没有便利可言;而如今,他们身处发达的互联网时代,有时甚至无法轻松的通过手机点外卖、通过滴滴叫车出行,享受和普通人一样的服务。

视障者们“足不出户”就能满足需求的生活,如何得以实现?

一台支持屏幕阅读的智能手机,就可能成为他们“与健全人一样”享受互联网服务的入口。如今,越来越多的互联网公司,在尝试为残障用户打造良好的用户体验。

从“接听电话”开始的系统优化

2018年年初发布的《2017中国信息无障碍十大进展》中,有一条是国内手机厂商纷纷开展信息无障碍行动:华为发布了信息无障碍宣传片、锤子把“无障碍模式”作为产品亮点来讲、小米把信息无障碍纳入开发流程,还点名了OPPO也有相关行动。

这些企业,出现在上周召开的首届「科技无障碍发展大会」上,该大会由信息无障碍产品联盟(CAPA)主办、信息无障碍研究会承办。

小米 MIUI 副总裁李伟星分享了小米在定制手机体验上的尝试和经验。

“在 Android 手机中,系统自带一个名为 Talkback 的功能,它能将手机系统中的每一个元素转换成语音,读出来。”李伟星告诉钛媒体记者,“这个技术实现起来的难度并不大。在过去,不少国内厂商在定制原生安卓和开放新功能时,没有意识做无障碍方面的适配,例如没有预置中文友好的TTS(文字转语音)引擎;或没有给界面元素做对应无障碍文字标识。”

要想实现系统层级上的屏幕阅读,首先需要系统框架中的每一个视觉元素拥有与之相对应的标签,这样“读屏兼容”才能将手机界面读出来。而“为每一个视觉元素添加标签”可以作为系统开发中的一个具体的标准。

在 MIUI 的开发团队中,并没有单独做上述工作的团队,但在内部有一个五人团队会持续协调MIUI产品对无障碍的适配。

当然,无障碍模式并不是“给视觉元素增加标签”这么简单。李伟星进一步解释,

“比如交互层面上的例子:接听电话的界面,正常用户接听的图标是跳动的,这是引导普通用户上滑接听电话的提示,明眼人会觉得很清晰易懂;而这对于视障者而言就是灾难——因为视觉元素跳动,所以读屏兼容做不到准确地告诉用户哪一个地方是接听键。

所以当,在“无障碍模式”开启之后的手机上,接听电话的提示是没有跳动提示的,“上滑接听改为点按接听”。

这只是视障者在智能手机体验上遇到的问题之一。

另一类问题则可以归结为——手机厂商很多时候会“好心办坏事”。

举个例子:在读屏兼容模式下,厂商对于屏幕中的视觉元素描述过多——视障者接受手机信息的高度依赖听觉,过度的语言描述会造成他们的信息接受过载,对于用户体验而言也是灾难。

那么,要如何把握好描述语言的多少,也是在交互优化中不得不思考的事情。

除了类似 MIUI 这样,在做系统层级的读屏兼容方面做出优化外,在系统框架外,还存在很多第三方应用来解决视障人士的困难。

李伟星表示目前 MIUI 还没有触及到第三方开发应用的层面。“不过,我们正在做一个无障碍精品应用的专区,当视障用户进入应用商店时,首页就会显示专区入口。”此外,小米的团队也暂时没有针对这一特定群体推出特别定制终端的打算。

MIUI 系统同时还在考虑如何将人工智能应用在特定的手机交互功能中。

比如将 MIUI 系统相册中的图像分类和拍照智能场景识别进一步优化,就有可能实现识别图像中的场景,并语音描述出来——这种“读图”的能力将极大地帮助障碍人群获取信息。

“不过目前这种技术还不完美,能应用的场景还有。将 AI 应用到无障碍优化层面,有很多突破点,但业界都还没有成熟的全面彻底的方案;MIUI 不排除与其他机构合作的可能。”李伟星表示。

硬件+软件协同

无障碍优化方向上,在软件层面上的探索走的最远是腾讯。

早在十多年前,腾讯就针对手机 QQ 做出了无障碍优化。最近,腾讯的社交产品 QQ 空间更是进一步地进行优化,加入了图片转图片(可以理解成看图说话)的功能。同时,腾讯方面也将会把这一无障碍技术,对外开放,通过在小程序“多媒体 AI 平台”上线“无障碍AI”入口,将一些可用于无障碍领域的人工智能技术对外开放接口,助力互联网相关行业的技术革新。该项目得到中国残疾人联合会的大力支持。

据钛媒体了解,该项目已经上线开放了可用于无障碍场景的三大AI技术,包括:

  1. 图片转语音:通过多层深度神经网络识别图片中的内容,并将图片中的内容有逻辑地组织成语言展示给调用者,能够帮助障碍用户阅读图片。
  2. 语音合成:通过机器学习与训练,可以定制化地将一段文字以特定角色诵读出来,并支持情绪调节。便于用户更加无障碍地体验文字转语音场景服务。
  3. OCR 识别:通过 AI 技术识别图片中的文字,便于用户在生活的各个场景中,对说明书、指示牌等文本检测领域信息获取更为便捷,并支持海量图片的文字搜索功能。

无障碍优化做的越早,对于企业而言,其成本也就越低。阿里巴巴 iOS 与Mac 团队负责人石佳锐表示,早在钉钉第三版,他们就考虑做无障碍优化了。“现在钉钉内部正在推动更多的适配工作。”

同时,国内的其他应用厂商,比如随手记,华鹏基金旗下的 A 加钱包,他们也在做应用内的无障碍优化。在他们的观点里,最几年比较火“普惠金融”的最基础一点就是要做到信息层面上的“普惠”,让任何人都能享受平等的金融服务。

“无障碍”现在障碍很多

相较于普通用户,视障者更依赖于无障碍服务,但是这并不意味无障碍服务就只是视障者专用的服务,这也是很多用户的思维误区,他们的观念依旧停留在“无障碍模式就是给盲人用的”。

实际上无障碍服务的理念是通用性——这意味着,即便是普通人也会有需要这一项服务时候。比如,对于老人而言,他们即便是没有任何眼疾,也有可能需要读屏兼容来辅助他们使用手机。再比如,微信上的语音转文字功能,它能便于用户在上班时间接受语音信息,实际上,它也方便了听力障碍者接受语音信息。

Accessibility-无障碍

“很多产品设计之初并没有考虑信息无障碍,很多产品没有意识到障碍群体庞大的用户量,往往到了使用环节,等收到用户大量反馈,被提醒信息获取困难,才开始考虑做无障碍。另外就是,很多产品还没有把无障碍纳入产品研发流程,一旦大改版或者人员架构调整,产品无障碍很有可能出现倒退。”信息无障碍研究会技术主管刘彪提到无障碍优化面临的另一问题。

“未来会有越来越多的新技术和新交互方式出现,如何将这些新技术和交互方式也做成无障碍模式,这也是未来不可避需要面对的问题。”

移动互联网的出现让原本处于“小世界”里的视障者也能像正常人一样,享受互联网带来的便利性。虽然无障碍模式还没有普及到所有的终端以及所有的软件层面上,即便是此模式依旧很很多需要优化和跟进的地方,但这一小步已经足够抹去残障人士与健全人的一些不平等了。

在科技无障碍发展大会上,信息无障碍研究会还发布了国内首支专业信息无障碍理念宣传片《拒绝失联》,片末是一群视障工程师利用业余时间组乐队在酒吧演唱《你是我的眼》。

乐队主创沈广荣是国内1700多万的视障人士中的一员,他同时是一名程序员。他说,“「你是我的眼」,这个「你」指的不是其他健全人,而是「科技」。”

[Source]

本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!

本文版权归原作者所有,如有侵权,请联系删除。

评论


猜你喜欢

扫描二维码或搜索微信号“iweiyangx”
关注未央网官方微信公众号,获取互联网金融领域前沿资讯。