• 使用 T5 探索迁移学习:文本到文本迁移转换器

    使用 T5 探索迁移学习:文本到文本迁移转换器

    RainNight 2021-09-28 人工智能谷歌翻译

    141°

    在过去几年中,迁移学习在自然语言处理(NLP)领域掀起了一波最新的研究成果。迁移学习的有效性来自于使用大量可用的未标记文本数据对模型进行预训练,并使用自我监督的任务,例如语言建模或填充缺失的单词。之后,可以在较小的标记数据集上对模型进行微调,这通常比单独在标记数据上训练产生(远)更好的性能。2018 年,GPT、ULMFiT、ELMo和BERT点燃了迁移学习的近期成功2019 年出现了大量新方法,如XLNet、RoBERTa、ALBERT、Reformer和MT-DNN。该领域的进展速度使得评估
  • 使用 TensorFlow 约束优化库设置公平目标

    使用 TensorFlow 约束优化库设置公平目标

    RainNight 2021-09-28 人工智能谷歌翻译

    111°

    许多使用监督式机器学习的技术对人们的日常生活产生了越来越积极的影响,从发现疾病的早期迹象到过滤不适当的内容。然而,人们越来越担心学习模型通常满足最小化单个损失函数的狭隘要求,可能难以解决更广泛的社会问题,例如公平性,这通常需要权衡多个相互竞争的考虑因素。即使将这些因素考虑在内,这些系统仍可能无法满足如此复杂的设计要求,例如,假阴性可能比假阳性“更糟”,或者正在训练的模型应该“类似于”一个预先存在的模型。 该TensorFlow约束优化(TFCO)库可以很容易地根据多个不同的指标(如配置和火车机器
  • 生成用于训练机器学习模型的多样化合成医学图像数据

    生成用于训练机器学习模型的多样化合成医学图像数据

    RainNight 2021-09-28 人工智能谷歌翻译

    108°

    医学成像机器学习 (ML)的进步有助于医生提供更好的诊断,部分原因是使用了大量精心标记的数据集。然而,由于隐私问题、合作机构的患者数量少或研究罕见疾病,数据集大小在现实生活中可能会受到限制。此外,为了确保 ML 模型能够很好地泛化,他们需要跨越一系列子组的训练数据,例如皮肤类型、人口统计和成像设备。要求每个组合子组的大小(例如,皮肤类型 A 和皮肤状况 B,由相机 C 拍摄)也足够大可能很快变得不切实际。 今天,我们很高兴分享两个项目,旨在提高 ML 训练数据的多样性,并增加医疗应用可用训练数据
  • AutoFlip:智能视频重构的开源框架

    AutoFlip:智能视频重构的开源框架

    RainNight 2021-09-28 人工智能谷歌翻译

    90°

    为电视和桌面拍摄和编辑的山景视频通常以横向纵横比(16:9 或 4 :3)。但是随着用户越来越多在移动设备上创建和消费内容时,历史纵横比并不总是适合用于查看的显示器。将视频重新构建为不同纵横比的传统方法通常涉及静态裁剪,即指定摄像机视口,然后裁剪外部的视觉内容。不幸的是,由于构图和相机运动风格的多样性,这些静态裁剪方法通常会导致不令人满意的结果。然而,更多定制方法通常需要视频策展人手动识别每一帧上的显着内容,跟踪它们从帧到帧的过渡,并在整个视频中相应地调整裁剪区域。这个过程通常是乏味、耗时且容易
  • 学习看透明物体

    学习看透明物体

    RainNight 2021-09-28 人工智能谷歌翻译

    88°

    等 3D 距离传感器已广泛应用于机器人技术,可生成丰富而准确的环境 3D 地图,从自动驾驶汽车到自动机械手。然而,尽管这些复杂的机器人系统无处不在,透明物体(如玻璃容器)甚至可以混淆常用的一套昂贵的传感器。这是因为光学 3D 传感器由假设所有表面都是朗伯表面的算法驱动,即它们在所有方向均匀地反射光线,从而从所有视角产生均匀的表面亮度。然而,透明物体违反了这个假设,因为它们的表面既折射又反射光。因此,来自透明物体的大部分深度数据都是无效的或包含不可预测的噪声。 ![file](/static/up
  • TyDi QA:多语言问答基准

    TyDi QA:多语言问答基准

    RainNight 2021-09-28 人工智能谷歌翻译

    83°

    问答技术每天都在帮助人们——当人们面临诸如“鱿鱼墨是否可以安全食用?”之类的问题时。,用户可以询问语音助手或键入搜索并期望得到答案。去年,我们向研究界发布了英语自然问题数据集,以提供一个挑战反映真实用户的需求。然而,有成千上万种不同的语言,其中许多使用非常不同的方法来构建意义。例如,虽然英语改变单词以表示一个对象(“book”)与许多(“books”),但阿拉伯语还有第三种形式来表示是否有两个(“كتابان”,kitaban),而不仅仅是单数(“ كتاب", kitab ) 或复数 (" ك
  • ML-fairness-gym:探索机器学习系统长期影响的工具

    ML-fairness-gym:探索机器学习系统长期影响的工具

    RainNight 2021-09-28 人工智能谷歌翻译

    72°

    机器学习系统已越来越多地用于辅助高影响力的决策,例如确定刑事判决、儿童福利评估、接受医疗护理的人员以及许多其他设置。了解此类系统是否公平至关重要,并且需要了解模型的短期和长期影响。评估机器学习系统公平性的常用方法包括评估系统各种输入的静态数据集的错误度量差异。事实上,许多现有的 ML 公平工具包(例如,AIF360、fairlearn、fairness-indicators、fairness-comparison ) 提供了对现有数据集执行这种基于误差度量的分析的工具。虽然这种分析可能适用于简单
  • 编码、标记和实现:一种可控且高效的文本生成方法

    编码、标记和实现:一种可控且高效的文本生成方法

    RainNight 2021-09-28 人工智能谷歌翻译

    91°

    序列到序列(seq2seq) 模型已经彻底改变了机器翻译领域,并已成为各种文本生成任务的首选工具,例如摘要、句子融合和语法错误纠正。模型架构(例如Transformer)的改进以及通过无监督预训练利用大量未注释文本的能力使我们近年来看到的神经网络方法的质量提高。 然而,根据用例的不同,使用 seq2seq 模型生成文本可能会带来许多实质性的缺点,例如产生输入文本不支持的输出(称为幻觉)以及需要大量训练数据才能达到很棒的表演。此外,seq2seq 模型在推理时本质上很慢,因为它们通常会逐字生成输出
  • 机器人操作的视觉迁移学习

    机器人操作的视觉迁移学习

    RainNight 2021-09-27 人工智能谷歌翻译

    97°

    该机器人能学会直接感知的想法启示的对象上的操作(即,什么机器人可以或不可以与对象做)被称为基于可供性的操作,探索学习复杂的基于视觉的操作技能,包括抓、推和扔. 在这些系统中,可供性表示为密集的像素级动作值图,用于估计机器人在每个位置执行多个预定义运动之一的效果。例如,给定 RGB-D 图像,基于可供性的抓取模型可能会使用卷积神经网络推断每个像素的抓取可供性。每个像素的抓取可供性值将代表执行相应运动原语(例如抓取动作)的成功率,然后机器人将在具有最高值的位置执行该动作。 ![file](/stat
  • 具有神经切线的快速简单的无限宽网络

    具有神经切线的快速简单的无限宽网络

    RainNight 2021-09-27 人工智能谷歌翻译

    169°

    深度学习在自然语言处理、会话代理和连接组学等一系列领域的广泛成功改变了机器研究的格局学习并给研究人员留下了许多有趣且重要的开放性问题,例如:为什么深度神经网络 (DNN) 尽管被过度参数化,但泛化能力如此之好?深度网络的架构、训练和性能之间有什么关系?如何从深度学习模型中提取显着特征? 近年来让我们取得进展的关键理论见解之一是,增加 DNN 的宽度会导致更规律的行为,并使它们更容易理解。最近的一些结果表明,允许无限宽的 DNN收敛到另一个更简单的模型类别,称为高斯过程。在这种限制的,复杂的现象(
  • Pixel 4 中基于 Soli 雷达的感知和交互

    Pixel 4 中基于 Soli 雷达的感知和交互

    RainNight 2021-09-27 人工智能谷歌翻译

    76°

    Pixel 4 和 Pixel 4 XL 已针对易用性进行了优化,有助于实现这一目标的关键功能是Motion Sense,它使用户能够无需触摸设备即可以多种方式与他们的 Pixel 交互。例如,借助 Motion Sense,您可以使用特定手势来更改音乐曲目或立即将来电静音。Motion Sense 还会检测您何时靠近手机以及何时伸手去拿手机,让您的 Pixel 能够通过预测您的动作(例如启动相机以提供无缝面部解锁)来提供更多帮助体验,在您伸手关闭闹钟时礼貌地降低响铃闹钟的音量,或者在您不再靠近
  • 使用 MediaPipe 在移动设备上进行实时 3D 对象检测

    使用 MediaPipe 在移动设备上进行实时 3D 对象检测

    RainNight 2021-09-27 人工智能谷歌翻译

    73°

    对象检测是一个广泛研究的计算机视觉问题,但大部分研究都集中在2D 对象预测上。虽然 2D 预测仅提供 2D 边界框,但通过将预测扩展到 3D,人们可以捕捉物体在世界中的大小、位置和方向,从而在机器人、自动驾驶汽车、图像检索和增强现实等领域得到广泛应用。尽管 2D 物体检测相对成熟并已在行业中得到广泛应用,但由于缺乏数据且类别内物体的外观和形状具有多样性,因此从 2D 图像中检测 3D 物体是一个具有挑战性的问题。 今天,我们宣布发布 MediaPipe Objectron,这是一种用于日常物体的
Collect from 雨夜的博客 雨夜的博客