ISBN/价格: | 978-7-121-47531-3:CNY118.00 |
---|---|
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | 视觉问答/.吴琦 ... [等]著/.王鑫,聂婕,朱文武译 |
出版发行项: | 北京:,电子工业出版社:,2024 |
载体形态项: | 223页:;+图 (部分彩图):;+24cm |
一般附注: | 博文视点 |
提要文摘: | 本书共5部分, 第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术, 包括卷积神经网络、序列建模和注意力机制等。本书将视觉问答分为图像和视频方法。第2部分将图像视觉问答进一步分为5类, 即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络。此外, 概述基于图像的其他视觉问答任务, 例如基于知识的视觉问答、视觉问答的视觉和语言预训练。第3部分讨论基于视频的视觉问答及其相关模型。第4部分讨论与视觉问答相关的高级任务, 包括具身视觉问答、医学视觉问答、基于文本的视觉问答、视觉问题生成、视觉对话和指代表达理解, 它们是视觉问答任务的扩展。第5部分对该领域进行总结与展望, 讨论视觉问答领域的未来研究方向。 |
题名主题: | 计算机视觉 图象处理 基本知识 |
中图分类: | TP391.41 |
个人名称等同: | 吴琦 著 |
个人名称次要: | 王鑫 译 |
个人名称次要: | 聂婕 译 |
个人名称次要: | 朱文武 译 |