深度学习之新闻多分类问题

平时除了遇到二分类问题,碰到最多的就是多分类问题,例如我们发布blogs时候选择的tag等。如果每个样本只关联一个标签则是单标签多分类,如果每个样本可以关联多个样本,则是多标签多分类。今天我们来看下新闻的多分类问题。 一、数据集 这里使用路透社在1986年发布的数据集,它包含很多的短新闻及其对应的主 ... »

使用Gensim库对文本进行词袋、TF-IDF和n-gram方法向量化处理

Gensim库简介 机器学习算法需要使用向量化后的数据进行预测,对于文本数据来说,因为算法执行的是关于矩形的数学运算,这意味着我们必须将字符串转换为向量。从数学的角度看,向量是具有大小和方向的几何对象,不需过多地关注概念,只需将向量化看作一种将单词映射到数学空间的方法,同时保留其本身蕴含的信息。 G ... »

绿色物流-智慧仓储监控管理 3D 可视化系统

在大数据、移动互联网、物联网、云计算等新兴技术高速发展背景下,智慧物流越来越受到政府与企业的重视,成为智慧城市建设的得力抓手和有力支撑。智慧物流的优势在于集成智能化技术,使物流全过程可自动感知识别、可追踪溯源、可实施应对、可智能化决策、各环节信息系统交互集成。而通过依托 HT 可视化技术,智慧仓储管... ... »

Protobuf在Cmake中的正确使用

Protobuf是google开发的一个序列化和反序列化的协议库,我们可以自己设计传递数据的格式,通过.proto文件定义我们的要传递的数据格式。例如,在深度学习中常用的ONNX交换模型就是使用.proto编写的。我们可以通过多种前端(MNN、NCNN、TVM的前端)去读取这个.onnx这个模型,但 ... »

主机回来以及,简单的环境配置(RTX3070+CUDA11.1+CUDNN+TensorRT)

紧接着前几天的事: 特殊的日子,想起了当年的双(1080TI)显卡装机实录 和 炼丹炉买不起了:聊一聊这段日子的显卡行情 之后,决定买一台整机玩玩。 而现在,主机终于回!来!了!主机回来干什么,当然是——配置环境。 老潘之前也有一些配置环境的文章,可以参考: ubuntu16.04下安装NVIDIA ... »

AI数学基础之:概率和上帝视角

简介 天要下雨,娘要嫁人。虽然我们不能控制未来的走向,但是可以一定程度上预测为来事情发生的可能性。而这种可能性就叫做概率。什么是概率呢?概率就是事情出现的可能性。比如扔骰子,我们知道骰子有六面,很容易知道扔出1点的概率是1/6,听起来很简单,但是如果放在复杂事件中,概率计算就变得比较麻烦和抽象,很多 ... »

机器学习系统或者SysML&DL笔记(一)

前言 在使用过TVM、TensorRT等优秀的机器学习编译优化系统以及Pytorch、Keras等深度学习框架后,总觉得有必要从理论上对这些系统进行一些分析,虽然说在实践中学习是最快最直接的(指哪儿打哪儿、不会哪儿查哪儿),但恶补一些关于系统设计的一些知识还是非常有用了,权当是巩固一些基础了。 因此 ... »

买不起炼丹炉了:谈一谈特殊时期的显卡情况

原文首发于公主号「oldpan博客」-> 原文链接在此~ 前言 前一阵子突然有了配主机的想法。呃,当然是为了搞深度学习。 想象一下,亲手买下自己心仪的配件,然后用心组装起来,闻着显卡的香气,啊,满满的成就感。 显卡预想着上RTX-3080或者3070,嗯,毕竟老潘已经是打工人了,有点小钱,除了上缴, ... »

CVer想知道的都在这里了,一起分析下《中国计算机视觉人才调研报告》吧!

最近闲来无事,老潘以一名普通算法工程师的角度,结合自身以及周围人的情况,理性也感性地分析一下极市平台前些天发布的2020年度中国计算机视觉人才调研报告。 以下的“计算机视觉人才”简称“人才”,感觉说人才有点怪怪的感觉?自己也算人才么?老潘只不过是一个普普通通的算法工程师罢了(逃)。 这个报告一共分为 ... »

AI数学基础之:奇异值和奇异值分解

简介 奇异值是矩阵中的一个非常重要的概念,一般是通过奇异值分解的方法来得到的,奇异值分解是线性代数和矩阵论中一种重要的矩阵分解法,在统计学和信号处理中非常的重要。 在了解奇异值之前,让我们先来看看特征值的概念。 相似矩阵 在线性代数中,相似矩阵是指存在相似关系的矩阵。设A,B为n阶矩阵,如果有n阶可 ... »

理解深度学习:神经网络的双胞胎兄弟-自编码器(上)

前言 本篇文章可作为<利用变分自编码器实现深度换脸(DeepFake)>的知识铺垫。 自编码器是什么,自编码器是个神奇的东西,可以提取数据中的深层次的特征。 例如我们输入图像,自编码器可以将这个图像上“人脸”的特征进行提取(编码过程),这个特征就保存为自编码器的潜变量,例如这张人脸的肤色以及头发颜色 ... »

浅谈深度学习的落地问题

前言 深度学习不不仅仅是理论创新,更重要的是应用于工程实际。 关于深度学习人工智能落地,已经有有很多的解决方案,不论是电脑端、手机端还是嵌入式端,将已经训练好的神经网络权重在各个平台跑起来,应用起来才是最实在的。 (caffe2-ios:https://github.com/KleinYuan/Ca ... »

实现TensorRT-7.0插件自由!(如果不踩坑使用TensorRT插件功能)

本系列为新TensorRT的第一篇,为什么叫新,因为之前已经写了两篇关于TensorRT的文章,是关于TensorRT-5.0版本的。好久没写关于TensorRT的文章了,所幸就以新来开头吧~ 接下来将要讲解的TensorRT,将会是基于7.0版本。 7版本开头的TensorRT变化还是挺大的,增加 ... »

Mac mini M1使用简单体验(编程、游戏、深度学习)

好久不见了各位! 前一阵子忍不住剁手买了M1芯片的mac mini,为了弥补自己的内疚感就卖了自己的旧的mbp2017款。数据也完全迁移到了新机器上,之前的工作也就由mbp2017彻底换成mac mini了,要换就换彻底点,不要给自己了留后路,哼。 为什么买mini而不是macbook系列,当然是为 ... »

思考:2021年还可以入门深度学习吗?

前言 过年时闲来无事,瞎翻自己的博客,偶然看到之前写的一篇文章: 一篇文章解决机器学习,深度学习入门疑惑 这篇文章原先发布于2018年中旬,那会正是深度学习、神经网络无脑火热的时候。火热到什么程度?火热到显卡一度卖脱销(不是因为挖矿),研究生导师集体推荐学生转深度学习方向、毕业论文不带“深度学习”四 ... »

LSTM - 长短期记忆网络

循环神经网络(RNN) 人们不是每一秒都从头开始思考,就像你阅读本文时,不会从头去重新学习一个文字,人类的思维是有持续性的。传统的卷积神经网络没有记忆,不能解决这一个问题,循环神经网络(Recurrent Neural Networks)可以解决这一个问题,在循环神经网络中,通过循环可以解决没有记忆 ... »

图像分类学习:X光胸片诊断识别----迁移学习

引言 刚进入人工智能实验室,不知道是在学习机器学习还是深度学习,想来他俩可能是一个东西,查阅之后才知道这是两个领域,或许也有些交叉,毕竟我也刚接触,不甚了解。 在我还是个纯度小白之时,写下这篇文章,希望后来同现在的我一样,刚刚涉足此领域的同学能够在这,跨越时空,在小白与小白的交流中得到些许帮助。 开 ... »

三种梯度下降算法的区别(BGD, SGD, MBGD)

前言 我们在训练网络的时候经常会设置 batch_size,这个 batch_size 究竟是做什么用的,一万张图的数据集,应该设置为多大呢,设置为 1、10、100 或者是 10000 究竟有什么区别呢? # 手写数字识别网络训练方法 network.fit( train_images, trai ... »