一 : 人工智能的种族主义源于算法 若现在不解决未来将更难
算法决定了我们生活中的很多东西,但是它在多样性上还有待改进。
编者按:替我们的生活做决定的算法越来越多,让我们越来越担心。这些算法决定了我们在互联网上看的是什么、我们多大程度上会变成受害者或者教唆犯罪的人。算法使用数据集合进行校验,但是这些数据集合并不包括各个不同的人群。
相关阅读:学坏容易学好难!人工智能将继承人类的种族和性别偏见
这可能是一个令人感到意外的结果:依赖算法做决定本质上具有倾向性。用谷歌、百度、必应等搜索引擎以“手”或者“婴儿”搜索图片,你会发现,这些图片大部分都是白皮肤。
使用bing搜索“婴儿”图片,首屏只有白皮肤婴儿的结果。
全球白网,平衡搜索结果的肤色占比
2015年,平面设计师Johanna Burai在谷歌上搜索人类“手”的图片,发现谷歌搜索最前面的结果只有白皮肤的手。随后,她发起了“全球白网”(World White Web)计划。通过她的网站,照片上传者分享不同肤色的照片,她的网站就可以提供“可选择”的手部图片,用来平衡不同的肤色占比,因此,谷歌等搜索引擎就可以抓取不同肤色的照片。
谷歌说,它的图片搜索结果是网络内容的反映,包括了某种类型的照片出现的频率、它们在网络上添加的描述。这些反映并不涉及它的“价值观”。
使用谷歌搜索“手”的图片,结果也一样。
Burai女士现在已经不维护她的网站了,她相信事情已经有所改观。她说:“我认为事情正在好转,人们看到了问题。当我发起这个计划的时候,人们很震惊,而现在对于这个问题,人们已经给予了更多的关注。”
算法正义联盟,检测算法是否具有偏见
2016年11月,麻省理工学院(MIT)的研究生Joy Buolamwini创办了算法正义联盟(AJL)。她试着在一个项目中使用面部识别软件,但是该软件不能加载她的面部,因为Buolamwini的肤色很深。
她说:“我肤色很深,而当我戴上白色面具的时候,系统更容易识别。戴上面具其实已经不能说是一张脸了,更适合称呼它为模型,而电脑可以轻易读取该模型。”
Joy Buolamwini发现,她的电脑能识别白色面具,而识别不了她肤色为黑色的脸。
这已经不是她第一次遇到类似的问题了。五年前,她不得不让一个皮肤颜色更浅的室友来帮助她。
“我感慨万千。我很沮丧。因为这是一个五年还没有被解决的问题,”她说:“我很震惊,因为白色面具居然那么容易被识别。”
Buolamwini女士说:“如果给你的系统做测试的人跟你很像的话,你的系统会运行地很好,然而你永远也不可能发现这其中有问题。”她把AJL的反响描述为“巨大且强烈的”。
老师们想要把她的工作展示给学生;研究员想请她检测他们自己的算法是否有偏见的迹象;人们向她报告自己的经历……这些人看起来似乎不少:一位研究员想检测皮肤癌确诊算法是否在深色皮肤中有效。
多样性报告,硅谷巨头们本身不具备多样性
Buolamwini女士认为,这种情况的出现,部分原因是技术行业本身就有着证据确凿的多样性缺失。
每年,科技巨头都会发布多样性报告,它们揭示了严肃的现状。
谷歌2016年1月份的最新数据显示,技术人员有19%是女性,只有1%是黑人。
微软2016年9月的数据显示,17.5%的技术人员是女性,2.7%的技术人员是黑人或者非裔美国人。
Facebook2016年6月的数据指出,美国国内的技术人员有17%是女性,1%是黑人。
有偏向的审美,数据集合单一的缺陷
去年有一场特殊的选美比赛,它收集了100个不同国家的大约6000张自拍,并让算法来判定选美结果。在44个获胜者当中,只有一个是非白人,极少数是亚洲人。
该选美比赛当中,18-29岁年龄段的女性获胜者之三,没有黑人,其他年龄段也没有。
Beauty.AI网站的首席科学家Alex Zhavoronkov告诉《卫报》,这个结果有缺陷,因为校验人工智能的数据集合不够具有多样性。他同时说道:“如果数据集合中白种人占比过大,那么实际上有可能得到有偏见的结果。”
更严重的是,根据网站Propublica的研究,人工智能软件在美国被用来预测哪一位罪犯可能再次犯罪时,它被发现更容易错误地把黑人罪犯识别为高再犯风险的人,而把白人罪犯识别为低再犯风险的人。
软件公司对该研究表示怀疑。
技术乐观主义者的解决之道
犹他大学计算机学院的副教授Suresh Venkatasubramanian(天呐名字好长)说,趁着问题仍然可见,人工智能的创造者现在就需要行动。
他对BBC说:“最坏的可能就是,事情发生变化了,而我们不再意识到它。换言之,值得关心的是,因为我们视根据算法作决策为理所应当,其中的偏见将从我们承认的人类偏见中,转移到我们不再承认,因此也无法察觉的事物上。”
我们是否创造了具有偏见的机器人呢?
然而他是一个技术乐观主义者。
他说:“所有的算法都表现出种族主义在我看来讲不通。并非因为这不可能,而是因为那不是算法实际运行的方式。过去三四年间,已讨论了关于算法的问题和可能的解决方法。“
他提供了一些方法:
创造更好、更具有多样性的数据集合来校验算法(例如:算法通过处理成千上万张图片进行学习);
分享软件供应商的最好的实践;
构建能够解释决定的算法,从而任何偏见都能够被理解。
Buolamwini女士说:“我现在开始想一个问题,老年人在科技领域也并没有自己的声音,我们有没有检测并确保这一系统对老年人同样有效呢?因为一些超重人士报告了问题,我就想,我们有没有关注并确保这一系统对超重人群同样有效呢?这绝对是击中人们心弦的问题。”
她现在也挺乐观的:“如果人们能够更多地意识到潜在的问题,她对现状的改善充满希望。其实我们所创造的任何技术,它们都是人类抱负和局限的反映。如果我们在包容性上充满局限性,这将会反映在我们开发的机器人上,或着纳入机器人的技术上。”
二 : 未来的智能机器人
现在已经2222年了,世界真是大不一样啊,多了发明——智能机器人。
现在已进入新时代了,正是有了智能机器人的存在,世界就像变了一个似的。我们从0岁说起:幼儿时妈妈抱着我们也不能做家务了,但是这个家有了机器人的存在就不怕这些七零八落的事没人干了,它可以为我们扫地、洗衣服、做饭等等:四五岁时,它的存在,给我们添加了不少的乐趣,他能变成玩具让我们玩;十一二时,正是我们对世界充满好奇的时候,如果我们想上天看看,它就能变成翅膀牢牢地架在我们背上,只要一动,我们便飞了起来,到云上玩个痛快!如果我们想看看水底世界,他立刻变成了一个透明的潜艇,我们进去后,看上去就个人,其实外面有层玻璃,等到水底后,我们就能看到蓝湛湛的海洋,海底竟然如此奇妙;十五六时,他就像一个专家为我们解答问题,不会的东西给我们讲个明白;二十七八时,如果我们离公司太远,他会变成汽车,这不是一般的汽车,他是自动的,并且会把你安安全全的送到你要去的地方。下班回来后,如果太累,不想做饭了,他就会自动变成厨师,为我们做事一顿即安全又有营养的餐。
我长大后一定要发明这样的智能机器人,为人类造福,我也希望这天早点到来。
五年级:蒋启尚
三 : 百度狠抓人工智能,他们能把握住互联网未来吗?
【IT时代周刊编者按】自从百度前不久邀请到了吴恩达这样的顶尖学者加盟后,在业界引起了很大的震动。在风风火火的外界舆论“轰炸”下,百度的技术路线愈发显得高大上。不过,本文作者却认为,以搜索为基础的人工智能技术,不一定能令百度把握互联网的主要未来。理由是想要做好人工智能这一块,应该补足连接人、物和数据的Big SNS,而这是目前的百度最缺乏的东西。
百度再次下狠手抓人工智能。
近日,在搬进硅谷新研发中心的同时,百度宣布任命人工智能领域最权威的学者之一吴恩达(AndrewNg)博士为百度首席科学家,全面负责百度研究院。这是中国互联网公司迄今为止引进的最重量级人物。
在经历去年一年频繁高调的资本并购之后逐渐冷却下来,移动互联布局晚了一步的百度开始将打法转向核心技术竞争,以寻求在BAT竞争中的差异化。去年夏天,百度设深度学习研究院IDL成立,由李彦宏亲自披挂上阵,继而在今年五月推出百度大脑计划,百度迅速走起一条看似更扎实、也更能直接地改变世界的技术路径。
然而,在风风火火的技术投资之下,一个不容忽视的问题浮现出来,仿效了谷歌的路径,引进了“谷歌大脑”之父,以搜索为基础的人工智能技术,真的能令百度把握互联网的主要未来吗?
错失社交蛋糕
在百度大脑计划的深度解析中,百度大脑分为三层设计——百度大脑,数据工厂,开放云,其中,开放云和数据工厂的分析完全是建立在搜索引擎之上,也就是说,百度大脑的数据库几乎完全来自搜索,这是百度的基因,而从另一方面来看,百度很可能错失了大社交网络中这块更大的蛋糕。
不仅仅是百度,包括谷歌,IBM在内的世界互联网巨头公司所启动的”大脑”计划,都局限在通过深度学习等人工智能算法不断提升其机器系统的智慧程度,而忽视了人的因素,人的智慧,人的主动性在互联网未来架构中所起到的核心作用。
在未来,随着物联网等信息技术发展,物、终端、人将会组成一个巨大的社交网络,这个社交网络则会将人与人,人与物连接起来,每天都会产生大量的用户数据,并且具有空前的规模性和群体性。截至2013年年底,国内社交工具QQ、新浪微博和微信用户数分别超过7亿,6亿和6亿,几乎涵盖大部分的中国人口,拥有海量真实用户与网络之间的实时联系信息。他们通过社交账号交流相互的信息,抒发自己的情感,解答对方的疑问,共享新的知识和智慧。这些社交账号像大脑的神经元一样不断的激活和熄灭,相互链接又不断解除关系,发出信息冲击波然后不断向外扩散。可以说,大社交网络表现出的群体智慧远高于人工智能。
社交搜索之博弈
更不容忽视的问题是,目前,从世界范围看,社交网络已经开始从搜索引擎中抽取流量。在未来主战场的移动端,用户的搜索习惯正在改变,碎片化成为一大特征。由于智能终端自身的性质,用户往往希望在一个常用的APP中实现搜索功能,而非再去占用内存下载一个搜索引擎软件。一些热门APP开始顺势而发,掌握着以亿为单位的信息流的社交网络,比如Facebook、Twitter、微信和微博,已经开始呈现内置搜索引擎之势,用户的搜索行为也正在渐渐开始从搜索引擎流向社交网络。
早在2010年的一个有关搜索引擎的报告中,社交网站Facebook和MySpace就已经分别排在第九位和第十二位,而在五家新闻顶级网站中,Facebook更是成为第二或第三大流量来源,在国内,不论是PC端还是在移动端,微信和QQ都可以向用户推送新闻,社交网络正在成长为一个强大的新闻推荐来源。
这样一来,可以看得到的未来是,当搜索引擎进一步萎缩,过度依赖搜索的百度如不尽快弥补一直一来的社交网络短板,最终将会画地为牢。
举一个形象的比喻,如果说搜索引擎为代表的是互联网左大脑,那么社交网络代表了互联网右大脑,没有右大脑支撑,互联网左大脑会萎缩,但反之不成立,比如也就是说,搜索不仅仅在网页进行,在社交网络上也会产生大量的流量。
如此看来,想要做好人工智能这一块,目前百度最需要去补足的,应该是连接人、物和数据的Big SNS。
【IT时代周刊编后】三年前,李彦宏在第一次谈到百度的社交战略时曾说,百度的社交战略是将社交元素整合入核心产品,而非单独发展一个社交网站。可是直到今天,我们仍未看到百度在社交产品上的突破。除了搜索业务,百度其实近年来有过很多的尝试,业务也堪称多元,但效果似乎并不理想。只有搜索这项业务依然支撑着百度。之前,国外有预测称,随着社交网站的风靡,传统的搜索引擎地位将没落。如今百度着力打造“百度大脑”,或许也是为了避免这一预测成真。但上文告诉他们,社交网络仍然重要,不可回避,这是接下来的百度应该首先要重视的一点。
互联网X.lab,微信公众帐号:Itxlab。
四 : 从未来简史到人工智能
< 一 >
短短一年不到的时间里,韩国棋手李世乭可谓「两世为人」。去年在与谷歌AlphaGo的较量中,他以一比四败下阵来,被人责怪在围棋这一人类传统文化的瑰宝项目中,耻辱地败给冷冰冰的机器。
很多人气哼哼地认为假如是别人,譬如三夺世界冠军的中国青年棋手柯洁出马,结局肯定不是这样。
镜头迅疾拉进到2016岁末2017年初的交替之时。
短短数日里,一位神秘棋手Master在网络快棋中横扫了人类高手,战绩是令人瞠目结舌的60胜0负1和。
令人尴尬的是,惟一的和局其实是人类棋手掉线,系统自动判和。而被击败的高手中,就包括柯洁等接近20位曾经获得世界冠军的中日韩职业棋手。
淡出一线已久的聂棋圣也披挂上阵,结果……你懂的。
神秘的Master最终亮明身份,原来它真的是AlphaGo——显然,它的棋力又有了长足的进步。
陡然间,李世乭成为惟一曾经击败AlphaGo的人类棋手。
鲜花呢?掌声呢?
< 二 >
不好意思。人们的注意力又一次聚焦在人工智能,带着十足的惊叹,间杂着一种难以言明的恐惧。或许一部书能够让我们以更加烧脑的方式,思忖人工智能以及它可能带来的一切。
这就是中信出版集团即将在国内出版的《未来简史:从智人到神人》。
《未来简史》的作者是尤瓦尔·赫拉利。没错,就是那位著有国际畅销书《人类简史》的以色列青年才俊。短短四年之后,他又带来一部奇书!
以其宏大的视角,赫拉利审视着人类未来的终极命运。《未来简史》甫一出版就在全球掀起狂潮,比尔·盖茨、扎克伯格等人纷纷将之列入必读书目。
至于在国内,罗辑思维主讲人罗振宇也在2016跨年演讲中,将《未来简史》列为最重要的一本书。
那么,这部书究竟说了些什么呢?赫拉利提出了一系列颠覆性的观点。
人类将进化成新物种——
随着以大数据、人工智能为代表的科学技术发展的日益成熟,绝大部分人将沦为「无价值的群体」,只有少部分人能进化成特质发生改变的 「神人」。
人作为个体的价值将不复存在——
我们这个时代的宗教是人文主义信仰,它基于个人是独立实体和自由意志的假设,而生命科学正在瓦解这些。
将近99%的人类工作都是毫无价值的——
人工智能和算法对人的作用与价值形成了极大的挑战。社会愈发达,人的分工愈专业,也就越容易被机器取代。大部分人在经济生活中不会再有价值。
算法将统治21世纪——
从数据主义的观点来看,全人类可能就是一个数据处理系统,而每个人只是里面的一个芯片。一旦这个系统找到了更高效的计算方式,人类很有可能被抛弃。
< 三 >
我们不得不说,作者的观点简直颠覆三观,令人几乎不敢直面未来的人生。按照《经济学人》的说法,赫拉利具有十足的反乌托邦情结——我个人比较认同这个观点。
不过我们还是能充分意识到人工智能的全面存在,即便是在《未来简史》之外。
在工业制造、码头运输等领域,很多繁重的工作,机器人早已取代了人类。而在很多某些传统白领的领域,机器的智能也逐渐有了用武之地。
只要拥有足够的数据和强大的计算能力,原则上人类曾经引以为豪的各种技能,在未来都有可能被机器掌握,并且做得更好。
譬如我们上面说到的AlphaGo,它已经摆脱了人类对围棋的认知,带着一种前所未有的视野,去「理解」围棋。这是人工智能的又一突破,更是对围棋的某种颠覆。
然而从更深层次,人工智能是我们驾驭未来,也将是驾驭人工智能本身的有力工具。
我们没有理由,也不可能放慢脚步。
尽管有人咬牙切齿地认为,人工智能是人类自己打开了潘多拉魔盒,在不经意间释放出的洪荒巨兽。
不过,人与人最终的差距,是想法。而对人工智能的迥异认知,也同样将是开启不同未来世界的钥匙。
< 四 >
赫拉利在书中写道:「那些永不知足又不负责任的造物主们连他们究竟想要什么都不知道,还有什么比这更危险的吗?」
没错。手上有了强大的技术力量,我们更应该想清楚究竟应该如何运用,才能够做到不被反噬——假如此类技术真的有darkness side。
戴尔联合中国科学院自动化研究所(CASIA)推出的全新深度学习平台——「诸葛·深知」,从计划创立之初,就坚定地将之定位在企业级应用,致力于帮助诸多行业真正实现人工智能应用。
随着数据量的指数级增长,企业越来越需要有效利用数据,将之应用于产品创新以及营销、市场、管理等领域。
认知、人工智能软件平台以服务形式交付训练认知模型,可供用户整理和分析各种结构化和非结构化信息,并据此做出决策。
市场分析机构IDC认为,在此类平台上交付支持人工智能的应用程序,需要以下两个主要组件:
■ 即时可用的训练模型——
使用并理清组织数据。
■ 训练机制——
帮助用户设计自己的认知模型。
「诸葛·深知」同时具备这两个组件,其即时可用的训练模型采用中科院自动化所研究人员优化过的大规模数据集进行训练,同时用户可利用自己的数据进一步训练这些模型。
「诸葛·深知」的计划建模功能,包括了图片分类、对象识别、图片分割、语音识别和分析、文本分类和分析等,可帮助组织迅速开始引入、改善和开发认知应用程序,来满足自身的业务需求。
< 五 >
诸葛·深知,最初面向的是金融服务和医疗保健服务。由于这些行业数据可用且能够进行实时操作的实际使用情形较多,「诸葛·深知」的模型专门针对此类行业进行了训练。
我个人认为这种行业选择非常正确。毕竟么,兜里有钱,身体健康,面对未来,心里不慌!
「诸葛·深知」能够帮助众多中国企业,实现基于深度学习的大数据分析和应用,从而加速步入人工智能新时代。
该平台具备四大特点,具体来说:
易用使用——
针对目前市场上五花八门的深度学习工具包、复杂的算法,该平台为企业提供了深度学习工具包的统一接口,众多中科院成熟算法模型可轻松调用。
调度优化——
该平台基于人工智能科研国家队最新技术成果,搭建在算法优化的高性能计算平台,持续研发保证。
安全可控——
中科院提供全新数据加密,保证客户数据安全,确保用于模型训练的客户数据全程加密。
定制服务——
针对特性应用场景提供定制化的深度学习算法模型训练及相关技术咨询培训,加速应用落地。
与此同时,「诸葛·深知」出色的可扩展性能够根据企业的需求进行扩展,交付世界一流的深度学习技术,并能保证最大限度地提高投资回报。
< 六 >
据IDC预计,截至2020年,40%的业务分析软件将引入基于认知、人工智能系统功能构建的规范分析技术。
利用「诸葛·深知」等解决方案,企业可将技术专业知识的应用重担交给平台执行,帮助企业即时看到改善运营的机会,并且为决策人员带来实时洞察,成就未来的企业。
作为一款混合解决方案,「诸葛·深知」可提供行业特定的人工智能技术和数据科学服务,并且大幅降低了企业的入门门槛,人工智能的企业级应用即将进入一个新的时代。
再说回到勾起本文话题的《人类简史》,它被认为是2017年最值得期待的新书。实际上,这本书是2014年出版的,只是中文版来得有些晚而已。
不过,「诸葛·深知」来得却正是时候,我们殷切期待它在各个行业领域的深入应用。
借用赫拉利在《未来简史》中的一段话作为本文的结束吧!
「一切都是数据处理。如果把每一个人都想象成一个处理器,人与人之间的交流就是信息交流,那么整个人类社会就是一个数据处理系统。整个人类历史,就是给这个系统增加效率的历史。」
本文标题:人工智能的未来-人工智能的种族主义源于算法 若现在不解决未来将更难61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1