MNIST手写数字识别——pytorch
MNIST手写数字识别是pytorch的经典项目之一,适用于新手学习pytorch这一深度学习训练平台以及初步了解计算机视觉的相关训练步骤。
在新手学习pytorch的时候,最好的教程就是Pytorch official Tutorial。以下的网络搭建主要参考pytorch的官方教程完成。
12345678import torch import torchvisionimport torchvision.transforms as transforms# 在windows显示图像的时候可能会遇到一个报错,需要添加这个语句才可以正常通过,意思是允许重复加载动态链接库import osos.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
首先引入几个重要的Package。
1234567device = torch.device("cuda" if torch.cuda.is_available() else 'cpu')dataset_root = './data ...
SGG领域论文整理(持续更新)
SGG 综述
“Visual Relationship Detection using Scene Graphs: A Survey”
arXiv检索2020
Aniket Agarwal Ayush Mangal Vipul
SGG 论文
“Scene graph generation by iterative message passing”
CVPR 2017
Danfei Xu Yuke Zhu Christopher B. Choy Li Fei-Fei
Department of Computer Science, Stanford University Stanford Computer Vision Lab
“Detecting visual relationships with deep relational networks”
CVPR 2017 oral paper
Bo Dai Yuqi Zhang Dahua Lin
Department of Information Engineering, The Chinese Univ ...
多模态融合——以KDD2020两篇论文为参考
两篇KDD2020论文的阅读笔记,了解多模态数据融合最新工作动态
SGG领域工作梳理
场景图生成概述场景图概念最先提出是在2015年stanford University的Justin Johnson等人提出的,目的是实现图像的检索任务(images retrieval using scene graph),通过将传统的文本转化为场景图之后作为输入传入检索模型,在模型中使用输入的文本语义图和场景图进行匹配,从而实现对于图像的更为精确的检索。
在Johnson的论文中定义的scene graph如下:
A scene graph is a data structure that describes the contents of a scene. A scene graph encodes object instances, attributes of objects, and relationships between objects.
简而言之,场景图就是一种描述图片中对象实体和属性以及实体间关系的一种数据结构。具体的结构定义如下所示:
可以看到由于场景图将图片的对象及其属性信息,乃至对象之间的关系全都纳入到结构化的图数据结构中,使得计算机对于图像的语义信息表达 ...
个人博客搭建[hexo+butterfly+github pages]
持续更新的建站攻略!本健忘者的备忘录!
Hello World
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
Quick StartCreate a new post1$ hexo new "My New Post"
More info: Writing
Run server1$ hexo server
More info: Server
Generate static files1$ hexo generate
More info: Generating
Deploy to remote sites1$ hexo deploy
More info: Deployment