NSDT工具推荐Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - AI模型在线查看 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 - 3D道路快速建模

在过去的二十年里,有超过 60 亿台设备上线。所有这些连接的“事物”(统称为物联网)每天都会产生超过 2.5 万亿字节的数据。这足以装满每天 575 亿台 32 GB 的 iPad(来源 Gartner)。所有这些数据必将在未来几年对许多业务流程产生重大影响。因此,物联网分析(物联网数据科学)的概念有望推动物联网的商业模式。据《福布斯》报道,强大的分析技能可能会使物联网的成功率提高 3 倍。

物联网数据科学有相似之处,但也有一些显着差异。以下是物联网数据科学与传统数据科学之间的 10 个区别:

  1. 使用硬件和无线电层
  2. 边缘处理
  3. 物联网垂直领域中使用的特定分析模型
  4. 物联网深度学习
  5. 物联网预处理
  6. 传感器融合在物联网中的作用
  7. 实时处理和物联网
  8. 物联网的隐私、保险和区块链
  9. 人工智能:机器互相学习(云机器人)
  10. 企业的物联网和人工智能层

1、使用硬件和无线电层

这听起来很明显,但很容易被低估。物联网涉及使用一系列设备以及各种无线电技术。这是一个快速变化的生态系统,采用LoRa、LTE-M、Sigfox等新技术。5G 的部署将产生重大影响,因为我们将同时拥有本地和广域连接。每个垂直领域(我们跟踪智能家居、零售、医疗保健、智能城市、能源、运输、制造和可穿戴设备)也有一组特定的物联网设备和无线电技术。例如,对于可穿戴设备,会看到正在使用蓝牙 4.0,但对于工业物联网,可能会看到保证服务质量的蜂窝技术,例如GE Predix 与 Verizon的联盟

2、边缘处理

在传统的数据科学中,大数据通常驻留在云端。物联网并非如此!思科和英特尔等许多供应商将其称为边缘计算。

3、物联网垂直领域使用的特定分析模型

物联网需要强调不同的模型,这些模型也依赖于物联网垂直领域。在传统的数据科学中,我们使用了多种算法(数据科学家使用的顶级算法)。对于物联网,经常使用时间序列模型。这意味着:ARIMA,Holt Winters,移动平均线。不同之处在于数据量,以及相同模型的更复杂的实时实现(pdf):ARIIMA:用于降低能耗的机器学习架构的真正物联网实现. 模型的使用因物联网垂直领域而异。例如在制造业:预测性维护、异常检测、预测和缺失事件插值很常见。在电信领域,客户流失建模、交叉销售、追加销售模型等传统模型可以将物联网作为输入。

4、物联网深度学习

如果将相机视为传感器,那么深度学习算法有很多应用,例如用于安全应用的 CNN,例如来自hertasecurity正如我在 Brandon Rohrer 关于强化学习和物联网的帖子中所讨论的,强化学习也适用于物联网。

5、物联网预处理

物联网数据集需要不同形式的预处理。Sibanjan Das 和我在Deep learning - IoT and H2O中提到了它。

深度学习算法在物联网分析中发挥着重要作用。来自机器的数据是稀疏的和/或其中包含时间元素。即使我们信任来自特定设备的数据,设备在不同条件下的行为也可能不同。因此,捕捉算法的数据预处理/训练阶段的所有场景是困难的。连续监测传感器数据也是繁琐且昂贵的。深度学习算法可以帮助减轻这些风险。深度学习算法自行学习,使开发人员可以专注于更好的事情,而不必担心训练它们。

6、传感器融合在物联网中的作用

传感器融合涉及来自不同传感器和来源的数据的组合,使得所得信息的不确定性低于单独使用这些来源时可能出现的不确定性。(改编自维基百科)。在这种情况下,术语“减少不确定性”可能意味着更准确、更完整或更可靠,或者是指基于组合信息的新兴观点的结果。传感器融合一直在航空航天等应用中发挥关键作用:

在航空航天应用中,加速度计和陀螺仪通常耦合到惯性测量单元 (IMU) 中,惯性测量单元 (IMU) 根据多个传感器输入测量方向,称为自由度 (DOF)。由于严格的精度和漂移容差以及高可靠性,用于航天器和飞机的惯性导航系统 (INS) 可能花费数千美元。

但我们越来越多地看到自动驾驶汽车和无人机中的传感器融合,其中来自多个传感器的输入可以组合起来以推断更多关于事件的信息。

7、实时处理和物联网

物联网涉及快速数据和大数据。因此,实时应用程序提供了与物联网的自然协同作用。许多物联网应用程序,如车队管理、智能电网、Twitter 流处理等,都具有基于快速和大数据流的独特分析要求。这些包括:

  • 实时标记:由于非结构化数据来自各种来源,从噪声中提取信号的唯一方法是对数据进行分类。这可能涉及使用Schema on the fly 概念
  • 实时聚合:每当您沿着滑动时间窗口聚合和计算数据时,您都在进行实时聚合:查找过去 5 秒内的用户行为记录模式并将其与过去 5 年进行比较以检测偏差
  • 实时时间相关性:例如:基于位置和时间识别新兴事件,来自大规模流式社交媒体数据的实时事件关联(以上改编自logtrust

8、物联网的隐私、保险和区块链

我曾经在欧盟参加过一次会议,会上提出了“筹码沉默”的想法。令人回味的标题模仿了电影“沉默的羔羊”。这个想法是:当你进入一个新环境时,你有权知道每一个监控你的传感器,并有选择地打开或关闭它。这听起来可能很极端——但它确实表明了在当今隐私讨论中占主导地位的布尔(开或关)思想。然而,未来物联网关于隐私的讨论可能会更加细致入微——尤其是当隐私、保险和区块链被一起考虑时。

根据AT Kearney的说法,物联网已经被保险公司视为一个重大机遇。Lloyds of London 等组织也在寻求通过在城市地区引入由传感器驱动的新技术来应对大规模的系统性风险,例如无人机。将区块链引入物联网创造了其他可能性——就像IBM 所说

将区块链概念应用于 [物联网] 世界提供了迷人的可能性。从产品完成最终组装的那一刻起,制造商就可以将其注册到代表其生命开始的通用区块链中。售出后,经销商或最终客户可以将其注册到区域区块链(社区、城市或州)。

9、人工智能:机器相互学习(云机器人)

我们之前提到了深度学习和物联网的可能性,我们说深度学习算法在物联网分析中发挥着重要作用,因为机器数据是稀疏的和/或具有时间元素。设备在不同条件下的行为可能不同。因此,捕捉算法的数据预处理/训练阶段的所有场景是困难的。深度学习算法可以通过让算法自行学习来帮助减轻这些风险。这种机器学习本身的概念可以扩展到机器教学其他机器。这个想法并不是那么牵强。

以全球最大的工业机器人制造商 Fanuc 为例。Fanuc 机器人通过观察和强化学习自学一夜之间执行任务。Fanuc 的机器人使用强化学习来训练自己。大约八小时后,它的准确率达到 90% 或更高,这几乎与专家对其进行编程一样。如果几个机器人并行工作,然后分享他们学到的东西,这个过程可以加速。这种分布式学习形式被称为云机器人

10、企业的物联网和人工智能层

我们可以在企业内部更一般地扩展“机器教其他机器”的概念。企业正在获得一个“人工智能层”。企业中的任何实体都可以培训企业中的其他“对等”实体。这可能是从其他建筑物中学习的建筑物——或者是飞机、石油钻井平台,甚至是打印机!培训可以是动态的和持续的(例如,一栋建筑了解能源消耗并“教授”下一栋建筑)。物联网是企业物联网系统的关键数据来源。目前,这种方法的最佳示例是 Salesforce.com 和 Einstein。强化学习是推动企业物联网和人工智能层的关键技术。

“到 2016 年底,全球收入最大的 100 家企业软件公司中,将有 80 多家将认知技术集成到他们的产品中。” (来源德勤)。

远离人工智能的冬天,我们似乎突然置身于人工智能的春天。而物联网在这个AI春天突然有了清晰的商业模式。

11、结束语

从上面的讨论中,我们看到物联网数据科学有许多相似之处,但也有显着差异。存在明显差异(例如在硬件和无线电网络的使用方面)。但对我来说,最令人兴奋的发展是物联网为令人兴奋的新领域提供动力,例如无人机、自动驾驶汽车、企业人工智能、云机器人等等。我们在物联网数据科学课程中涵盖了许多这些想法。


原文链接:Data Science for Internet of Things (IoT): Ten Differences From Traditional Data Science

BimAnt翻译整理,转载请标明出处