1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  • 一个快速 WordPiece 标记化系统

    一个快速 WordPiece 标记化系统

    RainNight 2021-12-28 人工智能谷歌翻译

    96°

    标记化是大多数自然语言处理(NLP) 应用程序的基本预处理步骤。它涉及将文本拆分为称为标记的较小单元(例如,单词或词段),以便将非结构化输入字符串转换为适用于机器学习(ML) 模型的离散元素序列。在基于深度学习的模型(例如,BERT)中,每个标记都映射到一个嵌入向量以输入模型。 ![file](/static/upload/bigpic/20211228/1640697870779183174.png) 一种基本的标记化方法是将文本分解为单词。但是,使用这种方法,未​​包含在词汇表中的单词将被视
  • 用于时间序列预测的可解释深度学习

    用于时间序列预测的可解释深度学习

    RainNight 2021-12-28 人工智能谷歌翻译

    106°

    多水平预测,即在未来多个时间步预测感兴趣的变量,是时间序列机器学习中的一个关键挑战。大多数现实世界的数据集都有时间成分,预测未来可以释放巨大的价值。例如,零售商可以利用未来的销售额来优化他们的供应链和促销活动,投资经理有兴趣预测金融资产的未来价格以最大化他们的业绩,医疗机构可​​以利用未来的入院人数来拥有足够的人员和设备. 深度神经网络(DNN)越来越多地用于多层面预测,与传统时间序列模型相比,表现出强大的性能改进。虽然许多模型(例如DeepAR、MQRNN)都专注于循环神经网络( RNN )
  • 【求知=>算法】存在重复元素

    【求知=>算法】存在重复元素

    RainNight 2021-12-25 求知=>算法

    162°

    ## 存在重复元素 --- 给定一个整数数组,判断是否存在重复元素。 如果存在一值在数组中出现至少两次,函数返回 true 。如果数组中每个元素都不相同,则返回 false 。 **示例 1:** --- > 输入: [1,2,3,1] > 输出: true **示例 2:** --- > 输入: [1,2,3,4] > 输出: false **示例 3:** --- > 输入: [1,1,1,3,3,4,3,2,4,2] > 输出: true ## 解题思路: 1. 根据数组的长度和通过set
  • 【求知=>算法】旋转数组

    【求知=>算法】旋转数组

    RainNight 2021-12-25 求知=>算法

    156°

    ## 旋转数组 --- 给你一个数组,将数组中的元素向右轮转 k个位置,其中 k是非负数。 **示例 1:** > 输入: nums = [1,2,3,4,5,6,7], k = 3 > 输出: [5,6,7,1,2,3,4] > 解释: > 向右轮转 1 步: [7,1,2,3,4,5,6] > 向右轮转 2 步: [6,7,1,2,3,4,5] > 向右轮转 3 步: [5,6,7,1,2,3,4] **示例 2:** > 输入:nums = [-1,-100,3,99], k = 2 >
  • 【求知=>算法】买卖股票的最佳时机 II

    【求知=>算法】买卖股票的最佳时机 II

    RainNight 2021-12-25 求知=>算法

    158°

    ## 买卖股票的最佳时机 II --- 给定一个数组 `prices` ,其中 `prices[i]` 是一支给定股票第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一支股票)。 **注意:**你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。 示例 1: > 输入: prices = [7,1,5,3,6,4] > 输出: 7 > 解释: 在第 2 天(股票价格 = 1)的时候买入,在第 3 天(股票价格 = 5)的时候卖出, 这笔
  • 【求知=>算法】删除排序数组中的重复项

    【求知=>算法】删除排序数组中的重复项

    RainNight 2021-12-25 求知=>算法

    183°

    # 删除排序数组中的重复项 --- 给你一个有序数组 `nums` ,请你 `原地` 删除重复出现的元素,使每个元素 只**出现一次** ,返回删除后数组的新长度。 不要使用额外的数组空间,你必须在 `原地` **修改输入数组** 并在使用 O(1) 额外空间的条件下完成。 **说明:** 为什么返回数值是整数,但输出的答案是数组呢? 请注意,输入数组是以**「引用」**方式传递的,这意味着在函数里修改输入数组对于调用者是可见的。 你可以想象内部操作如下: ``` // nums 是以“引用”方
  • python的append insert extend pop del remove使用

    python的append insert extend pop del remove使用

    RainNight 2021-12-25 Python

    133°

    ## python的 `append` `insert` `extend` `pop` `del` `remove`使用 对于 `python` 数组的操作,有插入和删除,下面介绍各个函数的功能: # 插入 插入的函数有 `append`、`insert` 、`extend` ## append `append(i)` 是在数组的末尾插入一个元素 `i` ,如下代码为在数组 `array` 的末尾插入元素 `10`: ``` array = [1, 2, 3, 4, 5, 6, 7, 8, 9]
  • 使用数据集蒸馏更有效地训练机器学习模型

    使用数据集蒸馏更有效地训练机器学习模型

    RainNight 2021-12-23 人工智能谷歌翻译

    129°

    要使机器学习 (ML) 算法有效,必须从(通常)大量训练数据中提取有用的特征。但是,由于在计算要求和挂钟时间方面与此类大型数据集的培训相关的成本,此过程可能具有挑战性。通过减少模型有效所需的资源,蒸馏的想法在这些情况下发挥着重要作用。最广为人知的蒸馏形式是模型蒸馏(又名知识蒸馏),其中大型复杂教师模型的预测被蒸馏成更小的模型。 这种模型空间方法的另一种选择是数据集蒸馏[ 1 , 2 ],其中将大数据集蒸馏为合成的较小数据集。用这样一个精炼的数据集训练模型可以减少所需的内存和计算。例如,不使用CI
  • RLDS:在强化学习中生成、共享和使用数据集的生态系统

    RLDS:在强化学习中生成、共享和使用数据集的生态系统

    RainNight 2021-12-23 人工智能谷歌翻译

    111°

    大多数强化学习(RL) 和顺序决策算法都需要代理通过与其环境的大量交互来生成训练数据,以实现最佳性能。这是非常低效的,尤其是当产生这些交互很困难时,例如使用真正的机器人收集数据或与人类专家进行交互。这个问题可以通过重用外部知识源来缓解,例如,RL Unplugged Atari 数据集,其中包括玩 Atari 游戏的合成代理的数据。 然而,这些数据集很少,而且在顺序决策中生成数据的任务和方式多种多样(例如,专家数据或嘈杂的演示、人工或合成交互等),这使得它不切实际,甚至不适合整个社区都在处理少量
  • MURAL:跨语言的多模式、多任务检索

    MURAL:跨语言的多模式、多任务检索

    RainNight 2021-12-23 人工智能谷歌翻译

    110°

    对于许多概念,没有从一种语言到另一种语言的直接一对一翻译,即使有,这种翻译也经常带有不同的联想和内涵,对于非母语人士来说很容易丢失。然而,在这种情况下,当以视觉示例为基础时,含义可能会更加明显。以“婚礼”这个词为例。在英语中,人们经常将穿着白色连衣裙的新娘和穿着燕尾服的新郎联系起来,但当翻译成印地语 (शादी) 时,更合适的联想可能是穿着鲜艳色彩的新娘和穿着雪瓦尼的新郎。每个人对这个词的联想可能会有很大差异,但如果向他们展示预期概念的图像,其含义就会变得更加清晰。 ![file](/stati
Collect from 雨夜的博客 雨夜的博客