• 突击pyspark:数据挖掘的力量倍增器

  • Redis技术实战

  • 实战Java高并发程序设计

  • python魔鬼训练营

  • 大数据的统计学基础

  • 开启智慧眼-深度玩转计算机视觉与机器认知

  • Hadoop应用开发实战案例--Hadoop进阶

  • MySQL DBA从小白到大神实战

构想:中文文本标注工具

自然语言处理的大部分任务是监督学习问题。序列标注问题如中文分词、命名实体识别,分类问题如关系识别、情感分析、意图分析等,均需要标注数据进行模型训练。深度学习大行其道的今天,基于深度学习的 NLP 模型更是数据饥渴。 最前沿的 NLP 技术往往首先针对英文语料。英文 NLP 的生态很好,针对不同有意思的问题都有不少大规模语料公开供大家研究,如斯坦福的 SQuAD 阅读理解语料。中文方面开源语料就少得多,各种英文 NLP 上的犀利模型和前沿技术都因为中文语料的匮乏很难迁移过来。另一方面,对于一些垂直领域,如医疗、金融、法律、公安等等,专有名词和特有需求甚多,很难将比较...[详情]

我们分析了54069个楼盘后,发现了中国楼盘取名的套路

上午在“巴黎阳光”散步,中午到“东方威尼斯”小憩,下午赶往“海上花园”……中国的楼盘起洋名早已见怪不怪,很多城市足不出户就能“欧洲一日游”,曼哈顿、维也纳、巴塞罗纳、威尼斯等国外地名,都成了中国楼盘的 ...

徒手实现CNN:综述论文详解卷积网络的数学本质

卷积神经网络(CNN)或称为 ConvNet 广泛应用于许多视觉图像和语音识别等任务。在 2012 ImageNet 挑战赛 krizhevsky 等人首次应用深度卷积网络后,深度卷积神经网络的架构设计已经吸引了许多研究者做出贡献。这也对 ...

用R语言分析我和男友的聊天记录

这篇文章大概在好几个月前就存在在脑海中。最开始是看了《迟到的情人节礼物:做一个与她微信聊天的词云吧》,觉得作者写的很好玩,那个时候因为工作的原因刚开始学习R语言,一窍不通,我就想着那就用R学着同样分析一 ...

Keras Image Data Augmentation 各参数详解

图像深度学习任务中,面对小数据集,我们往往需要利用Image Data Augmentation图像增广技术来扩充我们的数据集,而keras的内置ImageDataGenerator很好地帮我们实现图像增广。但是面对ImageDataGenerator中众多的参数 ...

如何使用深度学习为照片自动生成文本描述?

图像描述涉及到为给定图像(比如照片)生成人类可读的文本描述。这个问题对人类而言非常简单,但对机器来说却非常困难,因为它既涉及到理解图像的内容,还涉及到将理解到的内容翻译成自然语言。最近,在为图像自动生 ...

揭秘中国无人驾驶领域顶级赛事九年发展历程

今年7月,百度CEO李彦宏亲自乘坐百度与博世公司共同开发的阿波罗自动驾驶汽车,从公司到国家会议中心现场参加会议,全程15公里不碰方向盘,汽车自动识别路障,这一视频发出后震惊国人,开始有越来越多的人关注无人驾 ...

从硬件配置到框架选择,请以这种姿势入坑深度学习

深度学习初学者经常会问到这些问题:开发深度学习系统,我们需要什么样的计算机?为什么绝大多数人会推荐英伟达 GPU?对于初学者而言哪种深度学习框架是最好的?如何将深度学习应用到生产环境中去?所有这些问题都可 ...

构想:中文文本标注工具

自然语言处理的大部分任务是监督学习问题。序列标注问题如中文分词、命名实体识别,分类问题如关系识别、情感分析、意图分析等,均需要标注数据进行模型训练。深度学习大行其道的今天,基于深度学习的 NLP 模型更是 ...

如何写出整洁规范的R代码?是时候讨论一下代码规范性了

与注释一样, R语言中规范地对代码中的变量、函数和文件名进行命名也是一项 R 语言用户的基本操守。我知道身边大伙都很随性,字里行间通常笔走龙蛇不拘一格,但到了 R 语言这里,还是麻烦大伙儿规规矩矩的来。对 R ...

APP分层架构设计随想

互联网分层架构的本质,是数据的移动。互联网分层架构演进的核心原则:让上游更高效的获取与处理数据(复用),让下游能屏蔽数据的获取细节(封装)。不管数据怎么移动,最终都会汇聚到客户端。服务端的分层架构设计 ...

用 Vue 做一个酷炫的 menu

最近看到一个非常酷炫的menu插件,一直想把它鼓捣成vue形式,谁让我是vue的死灰粉呢,如果这都不算爱。开个小玩笑,我们一起来探索黑魔法吧。观看本教程的读者需要具备一定的vue和css3的知识。

美团点评数据库高可用架构的演进与设想

在2015年之前,美团点评(点评侧)长期使用MMM(Master-Master replication manager for MySQL)做数据库高可用,积累了比较多的经验,也踩了不少坑,可以说MMM在公司数据库高速发展过程中起到了很大的作用。整个MyS ...

使用 C 三十五年,我发现了它的三种替代语言!

著名的计算机程序员及黑客、《大教堂与市集》的作者、《新黑客词典》("Jargon File")的维护人、Fetchmail 程序作者 Eric S. Raymond(ESR)近日在个人博客上表示 C 语言的地位在逐渐下降,甚至已经出现了一些可 ...

盘点 2017 年度最受欢迎的十大 Linux 服务器发行版

是应用率最高、长期霸占排行榜的常青藤 Java?是易于上手,难以精通的 C?还是在游戏和工具领域仍占主流地位的 C++?亦或是占据 Windows 桌面应用程序半壁江山的 C#?......本周公布的超级计算机 Top 500 排行榜显示 ...

央行发布《关于规范金融机构资产管理业务的指导意见》

近年来,我国资产管理业务快速发展,在满足居民和企业的投融资需求、改善社会融资结构等方面发挥了积极作用,但也存在部分业务发展不规范、多层嵌套、刚性兑付、规避金融监管和宏观调控等问题。按照党中央、国务院决 ...

浅析PageRank算法

机器学习很早就对Google的PageRank算法很感兴趣,但一直没有深究,只有个轮廓性的概念。前几天趁团队outing的机会,在动车上看了一些相关的资料(PS:在动车上看看书真是一种享受),趁热打铁,将所看的东西整理成此 ...

详解PPP模式与PPP项目操作流程

按照PPP项目运作方式分类,主要包括委托运营(OM,Operations Maintenance)、管理合同(MC,Management Contract)、租赁-运营-移交(LOT,Lease-Operate-Transfer)、建设-运营-移交(BOT,Build- Operate-Transfe ...

因 AI 而更加红火的五种职业

“人工智能”(AI)这个词眼常常让人感到恐惧和忧虑。害怕AI的未知可能性,害怕像《终结者》这些电影所描绘的AI引起的反乌托邦式场景;最现实的是,害怕这种可能性:AI有一天会抢走我们的工作岗位。这种恐惧不是什么 ...