深度学习之新闻多分类问题

平时除了遇到二分类问题,碰到最多的就是多分类问题,例如我们发布blogs时候选择的tag等。如果每个样本只关联一个标签则是单标签多分类,如果每个样本可以关联多个样本,则是多标签多分类。今天我们来看下新闻的多分类问题。 一、数据集 这里使用路透社在1986年发布的数据集,它包含很多的短新闻及其对应的主 ... »

文字识别:关键信息提取的3种探索方法

摘要:如何通过深度学习模型来从文档图片中自动化地提取出关键信息成为一项亟待解决的挑战,受到学术界和工业界的广泛关注。 深度学习模型已经在OCR领域,包括文本检测和文本识别任务,获得了巨大的成功。而从文档中提取关键信息(如图1所示),其作为OCR的下游任务,存在非常多的实际应用场景。使用人力来从这些文 ... »

PaddleOCR详解

@ PaddleOCR简介 PaddleOCR分为文本检测、文本识别和方向分类器三部分,其中文本检测有三个模型,分别是MobileNetV3、ResNet18_vd和ResNet50,其中最常使用的是MobileNetV3模型,整体比较小,适合应用于手机端。文本识别只有一个MobileNetV3预训 ... »

Protobuf在Cmake中的正确使用

Protobuf是google开发的一个序列化和反序列化的协议库,我们可以自己设计传递数据的格式,通过.proto文件定义我们的要传递的数据格式。例如,在深度学习中常用的ONNX交换模型就是使用.proto编写的。我们可以通过多种前端(MNN、NCNN、TVM的前端)去读取这个.onnx这个模型,但 ... »

主机回来以及,简单的环境配置(RTX3070+CUDA11.1+CUDNN+TensorRT)

紧接着前几天的事: 特殊的日子,想起了当年的双(1080TI)显卡装机实录 和 炼丹炉买不起了:聊一聊这段日子的显卡行情 之后,决定买一台整机玩玩。 而现在,主机终于回!来!了!主机回来干什么,当然是——配置环境。 老潘之前也有一些配置环境的文章,可以参考: ubuntu16.04下安装NVIDIA ... »

机器学习系统或者SysML&DL笔记(一)

前言 在使用过TVM、TensorRT等优秀的机器学习编译优化系统以及Pytorch、Keras等深度学习框架后,总觉得有必要从理论上对这些系统进行一些分析,虽然说在实践中学习是最快最直接的(指哪儿打哪儿、不会哪儿查哪儿),但恶补一些关于系统设计的一些知识还是非常有用了,权当是巩固一些基础了。 因此 ... »

买不起炼丹炉了:谈一谈特殊时期的显卡情况

原文首发于公主号「oldpan博客」-> 原文链接在此~ 前言 前一阵子突然有了配主机的想法。呃,当然是为了搞深度学习。 想象一下,亲手买下自己心仪的配件,然后用心组装起来,闻着显卡的香气,啊,满满的成就感。 显卡预想着上RTX-3080或者3070,嗯,毕竟老潘已经是打工人了,有点小钱,除了上缴, ... »

图神经网络,这到底是个什么?

摘要:图神经网络是一种基于图结构的深度学习方法。 1、什么是图神经网络 图神经网络(Graph Neu做ral Networks, GNNs)是一种基于图结构的深度学习方法,从其定义中可以看出图神经网络主要由两部分组成,即“图”和“神经网络”。这里的“图”是图论中的图数据结构,“神经网络”是我们熟悉 ... »

机器学习(五):通俗易懂决策树与随机森林及代码实践

与SVM一样,决策树是通用的机器学习算法。随机森林,顾名思义,将决策树分类器集成到一起就形成了更强大的机器学习算法。它们都是很基础但很强大的机器学习工具,虽然我们现在有更先进的算法工具来训练模型,但决策树与随机森林因其简单灵活依然广受喜爱,建议大家学习。 一、决策树 1.1 什么是决策树 我们可以把 ... »

CVer想知道的都在这里了,一起分析下《中国计算机视觉人才调研报告》吧!

最近闲来无事,老潘以一名普通算法工程师的角度,结合自身以及周围人的情况,理性也感性地分析一下极市平台前些天发布的2020年度中国计算机视觉人才调研报告。 以下的“计算机视觉人才”简称“人才”,感觉说人才有点怪怪的感觉?自己也算人才么?老潘只不过是一个普普通通的算法工程师罢了(逃)。 这个报告一共分为 ... »

AI数学基础之:奇异值和奇异值分解

简介 奇异值是矩阵中的一个非常重要的概念,一般是通过奇异值分解的方法来得到的,奇异值分解是线性代数和矩阵论中一种重要的矩阵分解法,在统计学和信号处理中非常的重要。 在了解奇异值之前,让我们先来看看特征值的概念。 相似矩阵 在线性代数中,相似矩阵是指存在相似关系的矩阵。设A,B为n阶矩阵,如果有n阶可 ... »

理解深度学习:神经网络的双胞胎兄弟-自编码器(上)

前言 本篇文章可作为<利用变分自编码器实现深度换脸(DeepFake)>的知识铺垫。 自编码器是什么,自编码器是个神奇的东西,可以提取数据中的深层次的特征。 例如我们输入图像,自编码器可以将这个图像上“人脸”的特征进行提取(编码过程),这个特征就保存为自编码器的潜变量,例如这张人脸的肤色以及头发颜色 ... »

浅谈深度学习的落地问题

前言 深度学习不不仅仅是理论创新,更重要的是应用于工程实际。 关于深度学习人工智能落地,已经有有很多的解决方案,不论是电脑端、手机端还是嵌入式端,将已经训练好的神经网络权重在各个平台跑起来,应用起来才是最实在的。 (caffe2-ios:https://github.com/KleinYuan/Ca ... »

实现TensorRT-7.0插件自由!(如果不踩坑使用TensorRT插件功能)

本系列为新TensorRT的第一篇,为什么叫新,因为之前已经写了两篇关于TensorRT的文章,是关于TensorRT-5.0版本的。好久没写关于TensorRT的文章了,所幸就以新来开头吧~ 接下来将要讲解的TensorRT,将会是基于7.0版本。 7版本开头的TensorRT变化还是挺大的,增加 ... »

Mac mini M1使用简单体验(编程、游戏、深度学习)

好久不见了各位! 前一阵子忍不住剁手买了M1芯片的mac mini,为了弥补自己的内疚感就卖了自己的旧的mbp2017款。数据也完全迁移到了新机器上,之前的工作也就由mbp2017彻底换成mac mini了,要换就换彻底点,不要给自己了留后路,哼。 为什么买mini而不是macbook系列,当然是为 ... »