在 8 月 14 日的 SIGGRAPH 2018 大会上,英伟达 CEO 黄仁勋正式发布了新一代 GPU 架构 Turing(图灵),以及一系列基于图灵架构的 GPU,包括全球首批支持即时光线追踪(Real Time Ray Tracing)的 GPU 系列 Quadro RTX 8000、Quadro RTX 6000、Quadro RTX 5000,以及 Quadro RTX Server、CUDA10。Quadro 是英伟达的专业级显卡,主要面向设计、特效、科学可视化等视觉计算任务,具有 16T 单精度浮点性能,每秒 10G GigaRays/sec(GigaRays/sec,用来描述光线追踪性能),每秒 500T OPs 深度学习,支持 NVLink,每秒 100GB,支持每秒 500 万亿张量的操作。
黄仁勋表示,图灵架构是自 2006 年 CUDA GPU 发明以来最大的飞跃,是英伟达十多年来在计算机图像领域最大的创新。
据悉,三款新 GPU 预计今年第四季度发售,Quadro RTX 8000 配备 48GB 内存,售价 10000 美元;Quadro RTX 6000 配 24GB 内存,售价 6300 美元;Quadro RTX 5000 配 16GB 内,2300 美元 ESP。
近日,《自然》杂志上发表了关于谷歌 DeepMind 使用 AI 诊断眼疾实现重大突破的文章。结果显示,在 997 例患者的扫描测试中,DeepMind 的算法优于英国莫菲尔眼科医院(Moorfields Eye Hospital)的 8 名视网膜专家,诊断准确率达 94.5%。
DeepMind 的算法使用 Moorfields 提供的 14,884 个匿名 3D 视网膜扫描进行训练,并由医生标记为疾病征兆。为了使其决策更加透明,AI 开发了两个神经网络,可以发现模式并从大量数据中进行预测,其中第一个 AI 神经分割网络通过分析扫描以识别患病区域,而第二个神经分类网络则根据分析出的特定疾病类型,为临床医生提供诊断意见和转诊推荐。该神经网络会将这种推荐表示为百分比,因此临床医生能了解系统对其分析的置信度。
8 月 10 日,三星在发布会上推出新款手机 Galaxy Note 9 之外,同时登场的还有三三星智能音箱 Galaxy Home。
Galaxy Home 是三星与 AKG 合作的一款智能音箱产品,搭载了三星自家的 Bixby,配有 8 个麦克风和 6 个扬声器。除了本身功能性之外,还可以成为整个智能家庭的枢纽,对智能硬件进行操作。当天,三星电子并未提供关于 Galaxy Home 人工智能音箱的详细参数以及上市日期,但却表示将于 11 月份举行的开发者大会上展示更多关于这款音箱的消息。
三星在智能音箱市场姗姗来迟,在愈发激烈的竞争环境下如何夺得市场,我们拭目以待。
无人车和人类将如何互动?这是一个棘手的问题,因为人工智能系统在解决任务时往往与人类的行为不同。如今,加州大学伯克利分校的研究人员试图通过编程,教会无人车懂“礼貌”,让人车交互变得更简单。这项工作的目标是如何处理人类和汽车必须预测彼此行动的情况,例如当两者都靠近十字路口或改变车道时,机器人应该如何优化,尤其是需要考虑到人类不是完全理性的事实。
编程“礼貌”:研究人员基于“人类在评估他们的行为时会考虑损失大过收益”这一规律,确立无人车与人类驾驶车辆之间的关系,并建立了一个理论框架,以提高人类的驾驶体验为前提,让汽车预测它可以采取的行动。研究人员通过模拟人类驾驶车辆与无人车相遇时的场景来教会无人车“懂礼貌”,包括改变车道以减少对人类的不便,自动驾驶汽车在交叉路口左转时要等待人类驾驶车辆通过再采取行动,从而减少干扰。结果表明,“懂礼貌”的汽车往往会改善人们在道路上驾驶的体验,研究人员设定的礼仪参数越高,人类驾驶员的体验就越好。
此外,研究人员还观察到在涉及多辆汽车的复杂情况下(多代理),礼貌会让自动驾驶汽车阻止第三位驾驶员(后面的汽车)插队,直到人类驾驶员安全通过,然后机器人汽车才会去完成其任务。这是真正的协作行为,并且只在礼貌具有足够高的权重时才会发生。这对于真正的公路驾驶来说可能并不实用,但它可以在某些特定场景中设计高度礼貌的机器人,在这些场景中,人类比所有其他自动驾驶车辆具有更高的优先级。
我们正在朝着一个自治的时代前进,因此,创建出能够适应人类行为,并理解人类特性的人工智能系统将会加速时代的发展。从长远来看,这些系统的开发也可以让我们更好地了解人类自身的行为。
阅读更多:“懂礼貌”的自动驾驶车辆(https://arxiv.org/abs/1808.02633)
谷歌研究人员尝试使用进化方法,找到当今基于神经网络的系统中使用的基本算法之一——反向传播的替代品。他们通过设计特定于域的语言(DSL)来实现这一点,该语言描述了函数术语中的反向传播等数学公式,然后他们使用此 DSL 搜索数学空间,找到算法的更优版本。在这个进化搜索过程中,他们使用 DSL 自动探索此类算法的数学空间,并通过使用候选算法在 CIFAR-10 数据集上训练具有 16 层的 Wide ResNet 来定期评估进化的候选者。
进化搜索之后,研究人员在 Wide ResNet(在演化阶段使用的同一个)以及更大的 ResNet 上进行了 20 个 epoch 的测试,评估表现良好;同时,他们还在 ResNet 上测试 100 个 epoch 的表现来评估更长训练周期的表现。
结果显示,通过此进化搜索找到的性能最佳的算法比反向传播训练速度更快,但 100 个 epoch 的训练结果与传统反向传播相同。“之前的搜索实验表明,训练初始时更新方程运作良好,但在收敛时不如反向传播。这可能是由于搜索和测试制度之间不匹配,因为搜索使用 20 个 epoch 来训练初始模型,而测试使用了 100epoch,“他们写道。最初的加速会带来一些优势,但是这个方法在更长时期需要进一步验证,看它是否能够很好地泛化。
阅读更多:Backprop Evolution(https://arxiv.org/abs/1808.02822)。
来自德累斯顿国际大学(DIU)和 Fast.ai 的研究人员在 18 分钟内用 40 美元成功训练了 ImageNet。这非常重要,因为这意味着现在只需要 40 美元,几乎所有人都可以在一个相当大的数据集上训练大规模神经网络,这使得个体研究人员能够以相对较低的成本将他们的系统与广泛使用的计算密集型 benchmark 进行对比。
为了节省时间,团队开发了基础设施,可以轻松地在公共云上托管的机器上运行多个实验,同时还自动竞标 AWS 的“现货实例”定价,以获得最低计算成本。
许多组织使用复杂的分布式训练系统来进行大型计算,但 fast.ai 团队却在基础架构中使用最简单的方法实现了目标。“避免像 Docker 这样的容器技术,或像 Horovod 这样的分布式计算系统。我们没有使用具有单独的参数服务器、存储阵列、集群管理节点等的复杂集群架构,而只使用具有常规 EBS 存储卷的单个实例类型。
在调度程序上,他们使用了一个名为“nexus-scheduler”的系统来管理机器。Nexus-scheduler 由前 OpenAI 和谷歌员工 Yaroslav Butov 建造,类似于谷歌的开源系统 Kubernetes。
在代码改进方面,设计高效的基础设施的同时,Fast.ai 还对传统的训练方法进行了一些巧妙的 AI 调整,以最大限度地提高训练效率,包括部署一个可以处理可变图像大小的训练系统,它可以对矩形图像进行裁剪和缩放,这样训练便可加速 23%,且达 93%的准确度。
此类方法表明,个体或小团队能够轻松地利用容易获得的开源组件构建最佳系统,并以相对较低的成本在公有云上进行计算。这种民主化意味着更多的科学家可以进入人工智能领域,并进行大型实验来验证他们的方法。
阅读更多:任何人都可以在 18 分钟内完成 ImageNet 训练( http://www.fast.ai/2018/08/10/fastai-diu-imagenet/)。
墨尔本大学和当地大都会一名消防队员合作制造了一架无人机,可以使用商业现货(COTS)和开源组件自动绘制室内环境。这架无人机被称为 U.R.S.A(无人侦察安全飞机),由来自'Erle Robotics Company'的 Erle 四轴飞行器,用于在 2D 中映射其环境的 LiDAR 扫描仪,和一个测量地面距离的超声波传感器组成。其软件包括机器人操作系统(ROS),它部署在运行 Raspbian 操作系统的 Raspberry Pi 小型机上,以及驱动程序、导航、信号处理和 2D SLAM 等特定软件包。
这架无人机的功能包括
1)映射:探索空间并生成完整的地图,然后检查用卷尺测量的结果。该无人机系统能够精确地绘制空间,误差仅~0.05 米(5 厘米)。
2)导航:URSA 还可以在其主要路线被阻挡时找出替代路线;并且可以在导航期间转弯并通过狭窄的通道进入房间。
此系统展示出,现在,一个不太专业的团队利用商用开源组件就可以构建出相当成熟的东西。这揭露了技术滥用可能造成的后果,虽然现在此类算法和硬件平台水平非常有限,但若干年之后情况就不是这样了。留意此类活动可以让我们避免带来的风险。
阅读更多:使用无人机(UAV)进行精确的室内测绘。(https://arxiv.org/abs/1808.01940)。
微软近日分享了智能聊天机器人微软小冰创作诗歌的细节。在一篇研究论文中,来自微软、国立台湾大学和蒙特利尔大学的研究人员详细介绍了一种基于用户提交的图像生成诗歌的系统。该系统通过查看图像,使用预先训练的图像识别网络来提取图像中的对象和情绪,再使用更大的关联对象和情绪字典来扩充这些提取的术语,使用关键字生成诗句。随后,系统的句子评估器对生成的诗句进行单词语义一致性检查——这有助于保持所生成的诗歌的连贯性。该系统于去年推出,截至 2018 年 8 月,已帮助用户生成了 1200 万首诗。
研究人员从一个名为 shigeku.org 的网站收集了 2,027 首当代中国诗歌用作训练数据。随后,他们让 22 名观众作为评审,其中包括一部分现代诗歌爱好者,对由该系统生成的诗句与由 baseline(一个简单的字幕生成器),以及一个名为 CTRIP 的方法生成的诗句进行比较。结果,小冰和 CTRIP 都明显优于 baseline,而小冰系统的排名高于 CTRIP,因为它写的诗“富有想象力,感人和令人印象深刻”。
以下为此系统生成的一首诗,各位品一品如何:
翅膀紧紧抓住岩石和水
在寂寞中
在空洞中漫步
土地变得柔软
阅读更多:微软小冰图像生成诗歌(https://arxiv.org/abs/1808.03090)。
6 月,美国五角大楼正式成立了联合人工智能中心(JAIC),以协调和加速国防部人工智能的发展,并作为改善与科技和学术界合作的平台。
文化冲突:硅谷与国防部关系紧张;谷歌的 Maven 事件不仅显示出员工影响企业行为的力量,而且许多人将企业与军事合作视为一条红线。这可能是国防部人实现工智能目标的严重障碍,没有与科技和学术界的密切合作,这些目标无法实现。而这与美国在人工智能领域的主要竞争——中国形成鲜明对比,在中国,国家与私营部门联系紧密,JAIC 的目标是为国防部解决这个问题。
道德与安全:JAIC 的重点目标之一还包括建立军事 AI 中的道德和安全实践原则。
阅读更多:五角大楼首次 AI Hub JAIC 首次亮相(https://thebulletin.org/2018/08/jaic-pentagon-debuts-artificial-intelligence-hub/)。
政府经常要求从科技公司获取大量私人用户数据。2016 年,Google 收到了大约 3 万个来自政府的请求,涉及到 6 万用户。
奇怪的是,很多情况下这些数据很久之后才被公开(如果得以公开),用户信息是否被合理利用也未可知。麻省理工学院的新研究表明,我们或许可以利用加密货币中普及的技术,为执法机构提供加密选择,方便他们在日后提供调查细节,而如果法院要求信息被封存,则自行将此消息公之于众。该系统使用公共账本和名为多方合作(MPC)的方法。这让法院、调查人员和公司可以就请求进行沟通,讨论该行为是否合法,但请求的内容仍然保密,这是加密货币在公开验证设施上创建可定制、可验证合同的一个例子(如法院披露)。
随着人工智能为监控领域开辟出新的可能性,问责制和审查制度必须跟上发展的步伐。而加密技术提供了一种解决保密和透明化之间矛盾最有潜力的方法。
阅读更多:执法部门对监视负责(http://news.mit.edu/2018/holding-law-enforcement-accountable-for-electronic-surveillance-audit-0808)。
审计:保密程序问责制实践(https://eprint.iacr.org/2018/697.pdf)
作者 Jack Clark 有话对 AI 前线读者说:我们对中国的无人机研究非常感兴趣,如果你想要在我们的周报里看到更多有趣的内容,请发送邮件至:jack@jack-clark.net。
原文链接:
https://jack-clark.net/2018/08/13/import-ai-107-how-to-train-imagenet-in-18-minutes-for-40-why-courteousness-makes-for-better-self-driving-cars-and-google-tries-to-evolve-backprop-alternative/
如果你喜欢这篇文章,或希望看到更多类似优质报道,记得给我留言和点赞哦!