1. 1
  2. 2
  • 使用自我监督改进语音表示和个性化模型

    使用自我监督改进语音表示和个性化模型

    RainNight 2021-09-22 人工智能谷歌翻译

    语音处理中的许多任务通过拥有大量数据更容易解决。例如自动语音识别(ASR) 将语音翻译成文本。相比之下,“非语义”任务侧重于人类语音的意义以外的方面,包括“副语言”任务,如语音情感识别,以及其他类型的任务,如说话人识别、语言识别和某些各种基于语音的医疗诊断。在完成这些任务的训练系统中,一种常见的方法是利用尽可能大的数据集来帮助确保获得良好的结果。然而,直接依赖海量数据集的机器学习技术在小数据集上训练时往往不太成功。 弥合大数据集和小数据集之间性能差距的一种方法是在大数据集上训练表示模型,然后将其
  • 基于机器学习的灾害救援损害评估

    基于机器学习的灾害救援损害评估

    RainNight 2021-09-22 人工智能谷歌翻译

    地震、飓风和洪水等自然灾害影响大片地区和数百万人,但应对此类灾害是一项巨大的后勤挑战。危机响应者,包括政府、非政府组织和联合国组织,需要在灾难发生后快速获得全面和准确的评估,以规划如何最好地分配有限的资源。为此,超高分辨率 (VHR) 卫星图像,高达0.3 米分辨率正成为危机响应中越来越重要的工具,为响应者提供了前所未有的关于地形、基础设施和人口如何因灾害而变化的视觉信息。 然而,仍然需要大量的体力劳动才能从原始卫星图像中提取与运营相关的信息——倒塌的建筑物、桥梁的裂缝、人们设立临时避难所的地方
  • 从模板文档中提取结构化数据

    从模板文档中提取结构化数据

    RainNight 2021-09-22 人工智能谷歌翻译

    收据、账单、保险报价单等模板文件在各种业务工作流程中极为常见且至关重要。目前,处理这些文档主要是手动操作,并且确实存在的自动化系统基于脆弱且容易出错的启发式方法。考虑像发票这样的文档类型,它可以以数千种不同的方式排列——来自不同公司,甚至同一公司内不同部门的发票,格式可能略有不同。但是,对于发票应包含的结构化信息,例如发票编号、发票日期、到期金额、付款日期以及发票所发送的项目列表,存在共同的理解。 在ACL 2020接受的“用于从类似表单的文档中提取信息的表示学习”中,我们提出了一种从模板文档中
  • 用 DNA 编码化学和机器学习解锁“化学组”

    用 DNA 编码化学和机器学习解锁“化学组”

    RainNight 2021-09-22 人工智能谷歌翻译

    人类疾病疗法的大部分发展都建立在理解和调节蛋白质功能的基础上,蛋白质是许多生物活动的主要动力。布洛芬等小分子药物通常通过抑制或促进蛋白质的功能或其与其他生物分子的相互作用起作用。开发有用的“虚拟筛选”方法,可以通过计算而不是在实验室中评估潜在的小分子,长期以来一直是一个研究领域。然而,持续的挑战是建立一种在广泛的化学空间中工作得足够好的方法,以用于寻找与感兴趣的蛋白质具有物理验证的有用相互作用的小分子,即“命中”。 在最近发表在《药物化学杂志》上的“DNA 编码库的机器学习:命中发现的新范式”中
  • PEGASUS:抽象文本摘要的最先进模型

    PEGASUS:抽象文本摘要的最先进模型

    RainNight 2021-09-22 人工智能谷歌翻译

    Students 的任务通常是阅读文档并制作摘要(例如读书报告),以展示阅读理解和写作能力。这种抽象的文本摘要是自然语言处理中最具挑战性的任务之一,涉及对长段落的理解、信息压缩和语言生成。训练机器学习模型的主要范式是序列到序列(seq2seq) 学习,其中神经网络学习将输入序列映射到输出序列。虽然这些 seq2seq 模型最初是使用循环神经网络开发的,但Transformer编码器-解码器模型最近受到青睐,因为它们在对摘要中遇到的长序列中存在的依赖性进行建模时更有效。 结合自监督预训练的 Tra
  • 联合分析:无需数据收集的协作数据科学

    联合分析:无需数据收集的协作数据科学

    RainNight 2021-09-22 人工智能谷歌翻译

    联合学习,在2017年推出,使开发人员能够训练机器学习(ML)跨不集中的数据收集许多设备型号,以保证只有用户拥有的副本他们的数据,并用于功率经验表明像接下来的话和表达的Gboard为Android和提高智能回复的质量在Android的消息. 随着这些应用程序的成功,人们越来越有兴趣使用联合技术来回答有关去中心化数据的更多基本问题——例如计算计数或速率——这些问题通常根本不涉及 ML。通过这些技术分析用户行为可以产生更好的产品,但必须确保底层数据保持私密和安全。 今天我们将介绍联合分析,将数据科学
  • DADS:用于技能发现的无监督强化学习

    DADS:用于技能发现的无监督强化学习

    RainNight 2021-09-22 人工智能谷歌翻译

    最近的研究表明,监督 强化学习(RL)能够超越模拟场景合成在现实世界中复杂的行为,如抓任意对象或学习敏捷的运动。然而,使用精心设计的特定于任务的奖励函数来教代理执行复杂行为的局限性也越来越明显。设计奖励函数可能需要大量的工程工作,这对于大量任务来说是站不住脚的。对于许多实际场景,设计奖励函数可能很复杂,例如,需要额外的环境仪器(例如,传感器来检测门的方向)或手动标记“目标”状态。考虑到生成复杂行为的能力受到这种奖励工程形式的限制,无监督学习将自己呈现为 RL 的一个有趣方向。 在有监督的 RL
  • 使用 BLEURT 评估自然语言生成

    使用 BLEURT 评估自然语言生成

    RainNight 2021-09-22 人工智能谷歌翻译

    在过去的几年里,研究自然语言生成(NLG)取得了巨大的进步,高配车型现在能够翻译文本,总结文章,搞谈话,并在图片注释与前所未有的精度,使用与方法越来越高水平的复杂的. 目前,有两种方法来评估这些 NLG 系统:人工评估和自动度量。通过人工评估,人们使用人工注释器对模型的每个新版本进行大规模质量调查,但这种方法可能会非常耗费人力。相比之下,人们可以使用流行的自动度量(例如,BLEU),但这些通常是人类解释和判断的不可靠替代品。NLG 的快速进步和现有评估方法的缺陷要求开发新的方法来评估 NLG 系
  • 开源 BiT:探索计算机视觉的大规模预训练

    开源 BiT:探索计算机视觉的大规模预训练

    RainNight 2021-09-22 人工智能谷歌翻译

    计算机视觉研究人员的普遍感觉是,现代深层神经网络总是渴望更多的标签数据-国家的最先进的电流细胞神经网络需要对接受培训数据集,例如OpenImages或Places,其中包含超过 100 万个标记图像。然而,对于许多应用程序,收集如此大量的标记数据可能会让普通从业者望而却步。 缓解计算机视觉任务缺少标记数据的一种常见方法是使用已在通用数据上预先训练的模型(例如ImageNet)。这个想法是在通用数据上学习的视觉特征可以重新用于感兴趣的任务。尽管这种预训练在实践中效果很好,但它仍然缺乏快速掌握新概念
  • 启用电子纺织品微交互:通过螺旋结构的手势和光

    启用电子纺织品微交互:通过螺旋结构的手势和光

    RainNight 2021-09-22 人工智能谷歌翻译

    Textiles 有潜力通过改善美学、舒适度和人体工程学来帮助技术融入我们的日常环境和物品。消费设备已开始通过织物覆盖的智能扬声器和编织耳机线利用这些机会,而材料和柔性电子设备的进步使传感和显示能够融入柔软的外形,例如夹克、连衣裙和毯子。 ![file](/static/upload/bigpic/20210922/1632318452028094321.png) 在“ E-textile Microinteractions ”(ACM CHI 2020论文集)中,我们为软设备带来了交互性,并展
Collect from 雨夜的博客 雨夜的博客