• 深入理解Storm与大数据实战

  • Python突击-从入门到精通到项目实战

  • 黄美灵的Spark ML机器学习实战

  • ROS机器人操作系统实战

  • Kafka原理剖析及实战演练

  • 高可用架构设计与实践

  • 大数据的Linux基础

  • DevSecOps安全交付应用实战

多维数据可视化方法,看这一篇就够

多维数据可视化是指通过一些手段将高维的数据展示在二维的平面中。在进行探索性数据分析及对聚类或分类问题的验证中有着重要的应用。Andrews曲线将每个样本的属性值转化为傅里叶序列的系数来创建曲线。通过将每一类曲线标成不同颜色可以可视化聚类数据,属于相同类别的样本的曲线通常更加接近并构成了更大的结构。平行坐标可以看到数据中的类别以及从视觉上估计其他的统计量。使用平行坐标时,每个点用线段联接,每个垂直的线代表一个属性,一组联接的线段表示一个数据点。可能是一类的数据点会更加接近。RadViz图是基于基本的弹簧压力最小化算法(在复杂网络分析中也会经常应用)。简单来说...[详情]

用深度学习解决自然语言处理中的7大问题,文本分类、语言建模等

自然语言处理领域正在从统计学方法转向神经网络方法。在自然语言中,仍然存在许多具有挑战性的问题。但是,深度学习方法在某些特定的语言问题上取得了state-of-the-art的结果。不仅仅是在一些benchmark问题上深度学 ...

“信息瓶颈”理论揭示深度学习本质,Hinton说他要看1万遍

利用深度神经网络的机器已经学会了交谈、开车,在玩视频游戏和下围棋时击败了世界冠军,还能做梦、画画,帮助进行科学发现,但同时它们也深深地让其发明者困惑,谁也没有料到所谓的“深度学习”算法能做得这么好。没 ...

揭开深度学习黑箱:希伯来大学计算机科学教授提出「信息瓶颈」

耶路撒冷希伯来大学的计算机与神经科学家 Naftali Tishby 提出了一项名为「信息瓶颈」(Information Bottleneck)的新理论,有望最终打开深度学习的黑箱,以及解释人脑的工作原理。这一想法是指神经网络就像把信息挤 ...

从语言学到深度学习NLP,一文概述自然语言处理

首先第一部分介绍了自然语言处理的基本概念,作者将 NLP 分为自然语言理解和自然语言生成,并解释了 NLP 过程的各个层级和应用,这一篇论文很适合读者系统的了解 NLP 的基本概念。第二描述的是基于深度学习的 NLP, ...

如何在RStudio中预览数据

RStudio有数据预览功能,能够一目了然的查看数据和数据结构,并且能够做简单的数据分析,更容易理解如何在R中整理数的过程。正如需求,你可以对数据的列进行排序,只需要点击数据的对应列,然后点击字段名,自由切换 ...

加强深度学习能力以简化设计、训练和部署模型

MATLAB Release 2017b (R2017b) 今日正式推出,其中包括 MATLAB 和 Simulink 的若干新功能、六款新产品以及对其他 86 款产品的更新和修复补丁。此发行版还添加了新的重要的深度学习功能,可简化工程师、研究人员及其 ...

128篇论文,21大领域,深度学习最值得看的资源全在这了

对于大多数想上手深度学习的小伙伴来说,“我应当从那篇论文开始读起?”这是一个亘古不变的话题。而对那些已经入门的同学来说,了解一下不同方向的论文,也是不时之需。有没有一份完整的深度学习论文导引,让所有人 ...

完全基于卷积神经网络的seq2seq

今天要讲的一个模型是由Facebook人工智能研究院提出来的完全基于卷积神经网络的seq2seq框架,seq2seq我在之前的推送中已经讲过好多次了,传统的seq2seq模型是基于RNN来实现的,特别是LSTM,这就带来了计算量复杂的问 ...

Bengio号召拆分科技巨头,称政府表现太温顺

近日,人工智能先驱Yoshua Bengio表示,科技巨头的财富集中导致权利和能力的集中,造成行业垄断,不利于民主。当被记者问及是否应该拆分科技公司时,一向淡定Bengio轻哼了下说,应该强制实行反托拉斯法禁止垄断行为 ...

最新诺奖预测出炉!华裔女科学家成热门

一年一度的诺贝尔奖是学术界最大的盛事之一。随着2017年诺贝尔奖公布的时间进入一个月倒计时,陆续有机构开始“押宝”谁会是今年的得主。当地时间9月20日,科睿唯安(原汤森路透知识产权与科技事业部)公布了最新的 ...

Java 9 正式发布,终落地 Jigsaw 项目

9 月 21 日,大家期待已久的 Java 9 终于正式发布了,本文与大家一起快速回顾一下 IntelliJ IDEA 中 Java 9 的支持,并了解 IntelliJ IDEA 2017.3 中针对 Java 9 的推出的新功能。Jigsaw 和 JPMS提及 Java 9,最大的 ...

为什么LinkedIn放弃MySQL slowlog,用基于网络层慢查询分析器

LinkedIn 大量使用MySQL,公司内部 500 多个服务依赖于MySQL。 为了方便管理以及提高资源利用率,我们使用多租户架构模式。 然而这种模式的一个主要缺点是,来自一个应用程序的查询可能会影响到其他应用程序。虽然我 ...

Linux 文件系统概览

本文旨在高屋建瓴地来讨论 Linux 文件系统概念,而不是对某种特定的文件系统,比如 EXT4 是如何工作的进行具体的描述。另外,本文也不是一个文件系统命令的教程。每台通用计算机都需要将各种数据存储在硬盘驱动器(H ...

来了,Apache Kylin在百度外卖流量分析平台的应用与实践~

流量分析平台是通过对进入百度外卖App的流量从路径、大区、城市、商圈、终端、版本、渠道等多个维度进行分析,帮助活动运营、渠道运营、产品经理、产品运营、大区经理等角色更好的了解其业务的流量情况,从而进一步 ...

记一次 MySQL 找回用户数据

有天,我们公司外区的一个销售C说他8月3号以前的工作流记录找不到了。问清缘由,原来是更新了微信号(我们公司的工作流是基于企业微信开发的)。经过分析,微信号和流程数据并没什么关系,所以初步得出结论:本来只 ...

论文都看不懂,你还搞什么人工智能?

第一部分我将首先讲解如何从零基础开始阅读一篇机器学习方向的论文,以及对待论文中的数学问题。随后,从一篇经典论文入手,讲解如何快速梳理和理解一个深度学习框架及模型。最近人工智能和机器学习方向的论文非常多 ...

人工智能行业就业指南:平均薪酬20K 帝都最适合

人工智能可谓是目前最热门的行业,热门的行业通常意味着工作机会和薪酬待遇都跟着增加,那么对于热门中的热门,人工智能领域薪酬水平和人才供需情况到底如何呢?下面就通过 11 张统计图来看看,这个“风口”行业的人 ...

我国物联网传感器和芯片两大核心技术仍受制于人

物联网通过传感装置,将物理世界转换成数字世界,进而实现物与物、人与物相联。经过8年的发展,我国物联网发展有了长足进步,但仍面临一些瓶颈,比如两大基础核心技术——传感器和芯片仍受制于人。同时,也面临应用 ...