引产入校 文章详情

科普 | 详解文本数据标注类型及应用场景

2022-08-19 14:21:50 作者小当老师


文本数据标注作为最常见的数据标注类型之一,是指将文字、符号在内的文本进行标注,让计算机能够读懂并识别。从本质上来看,文本数据标注就是一个监督学习的过程,而标注问题就是更复杂结构预测问题的简单形式。


标注问题的目的在于学习模型,使该模型能够对观测序列给出标记序列作为预测。这也决定了标注问题的工作流程,即输入是一个观测序列,之后输出是一个标记序列或者状态序列。需要注意的是,标记个数是有限的,但其组合所成的标记序列的个数是依照序列长度呈指数级增长的。



今天我们来详细了解一下文本数据标注类型及应用场景。


图片




01//


文本数据标注类型



文本数据标注类型包括:序列标注、关系标注、属性标注和类别标注。


①  序列标注:是一个比较简单的自然语言处理(Natural Language Processing,NLP)NLP任务,也是最基础的任务。序列标注的涵盖范围非常广泛,包括分词、实体、关键字、韵律、意图理解等。


②  关系标注:对复句的句法关联和语义关联做出重要标示的一种任务,是复句自动分析的形式标记。关系标注包括:指向关系、修饰关系、平行语料等等。


③  属性标注:对事物属性进行标签,属性标注包括:文本类别、新闻、娱乐等。


④  类别标注:对文章的类别进行标注,例如篇章级的阅读理解等。


图片





02//


文本数据标注应用场景



文本数据标注是最常见的数据标注类型之一,在现实生活中也得到了充分应用。具体来说,文本数据标注应用比较多的场景包括:新零售、客服行业、广告营销、金融行业和医疗行业等,具体介绍如下:


①  新零售行业新零售需要重塑零售行业的服务模式,因此需要对客户的问题进行精准定位,既需要对客户的问题进行量身定制,又需要考虑多数客户的共性要求,这就需要借助文本数据标注的方法,将顾客的相应问题做出标记。


图片


②  客服行业随着互联网技术的兴起,电子客服越来越多的取缔了人工客服。电子客服同样也可进行文字客服、视频客服和语音客服三类,这就需要机器对客户说话方式进行识别。考虑到不同人的说话方式不同、说话习惯不同,因此,对于同一个问题提问的方式也会不同。但是对于机器而言,面对同一问题,顾客提问方式虽然不同,但做出的回答应该是完全相同的。这就要求把对同一问题的不同提问方式进行学习,从而做出回复。


图片


③  广告行业对某产品进行广告设计时,通常会把类别相近的且销量较高的商品文案相互借鉴,把已经有的单个商品文案进行综合,取其精华、去其糟粕,通过文本数据标注把文案中的“精华”与“糟粕”标记出来,这让文案设计工作者可以在案例中进行提取综合,这无疑提高了工作人员的工作效率。


图片


④  金融行业在企业的商务合同中,关键信息的读取显得尤为重要。例如:合同中提到的公司名称、合同编号、发票编号、相关金额、到期日期和风险提示等内容,这些内容囊括了甲乙双方公司的核心信息。对于一个规模较大的公司来说,每天的签约合同非常之多,这时用人工智能对合同中的相关信息进行提取,可以大幅减少劳动力,降低人力成本、提高工作效率。


图片



以上主要介绍了文本数据标注的类型及应用场景等。文本数据标注是对工作细心程度、耐心程度、专注力强度以及知识储备能力要求较高的一项任务,需要标注人员在熟知概念与规范的前提下,勤加练习。


相关阅读

科普篇 | 什么是视频数据标注?视频数据标注有哪些意义?

视频数据标注是用机器自动生成自然语言文字来描述视频内容的过程。它在视觉和文字之间起到非常重要的桥接作用。视频数据标注目的是对场景中活动目标进行位置、形状、动作、色彩等有关特征进行标注;提供大量数据供跟踪算法使用,从而实现对场景中活动目标进行检测、跟踪、识别,以及进一步的行为分析及事件检测。视频数据标注有哪些意义?(1)视频数据标注是实现视频搜索功能的必然要求。互联网中的视频数据正以惊人的速度在增长,必须有新的检索方式来满足用户对视频的检索需求。而视频数据标注通过语义、内容等方式标注,则有利于视频数据搜索、管理和收藏。(2)视频数据标注要求是视频数据自身特征决定的。丰富的视频数据包含的海量信息,其内容更加丰富、直观和生动。这是其他媒体类型所无法比拟的。因此,视频数据的自身优势,决定了视频数据标注的发展前景更广阔。(3)视频数据标注是视频数据应用场景日益增加的需求。与图像技术一样,视频数据也可以应用于互联网娱乐、智能家居、智能医疗、新零售、安防、自动驾驶等领域。而且,相较于图像数据而言,图像数据是在一个时间点上的数据,而视频数据是在一段时间上连续的一系列图像数据的集合,表达的信息更加丰富,因此具有更广的应用场景。视频数据标注任务介绍视频数据标注任务包含视频标签的时间位置、空间位置和标签信息标注等内容。标注文件的输出格式推荐使用易解析、易存储的数据格式,包括JSON、XML等。标注文件应该包含详细的标签信息。每个独立的标签应包含以下的信息:(1)标签编码:每个标签的独立编号;(2)文件路标:待标注视频文件名称或路径;(3)置信度:为标签的置信度;(4)每个标签中可能包含多个对象,对于每个对象需包含:      ①对象类型:例如 scene_classification;      ②对象详情:具体描述对象的时间、空间信息和内容信息,或与其他 object的关系信息。对于视频中起始和结束帧的位置描述也应该放到对象详情中,比如:Object frame_index start 以及Object_frame_index_end。本文主要介绍了视频数据标注及其意义和视频数据标注任务的介绍,视频数据标注区别于图像数据标注主要是有时间轴,且视频数据标注能预测人们行为和物体运动轨迹,将会在更多场景取得更加智能化的应用。希望这篇文章对正在从事数据标注工作有所帮助!

小当老师 2022-12-05 09:41:31

科普篇 | 3D点云数据标注工具的功能及使用方法

3D点云标注是指利用激光雷达采集的数据进行框选标注,供计算机视觉与无人驾驶等人工智能模型训练使用。下面我们来了解以下3D点云数据标注工具的功能及使用方法。01//3D点云标注工具的主要功能3D点云标注能够实现3D单帧标注、2D-3D单帧映射、3D追踪标注等功能:(1)3D单帧标注:可以提供点云或者点云与时间对齐的图片,但只标注点云。(2)2D-3D单帧映射:2D和3D同一物体ID相同。(3)3D追踪标注:追踪同一物体ID一致。注:2D-3D映射需要提供校准信息,每个摄像头均要提供(摄像头的内参和到激光雷达坐标映射的外参)。02//3D点云工具的使用方法3D点云标注工具界面由工具栏、主视图、三视图、帧控制区域、状态栏、属性区、对象列表区等七部分构成,工具界面如下图所示。下面进行具体介绍。(1)工具栏工具栏用于整体任务或者显示的控制。主要包括如下内容:①获取任务:获取一条数据用于标注;②保存:用于手工将标注数据临时保存在磁盘上,防止丢失;③提交:用于标注等工作完成后提交结果;④撤销:撤销上一个标注操作,最多可以10步。⑤恢复:恢复上一个撤销的操作。⑥删除图形:删除选中的对象。⑦隐藏标签:不显示所有对象的标签。⑧隐藏图形:主视图和街景中不显示所有对象。⑨合并ID:用于找回对象,把两个不同的ID合并为一个,复制之前的属性。其他功能包括工作量统计、类别统计、计时和到期时间等。(2)主视图有两种模式,3D模式和俯视模式。主视图是3D点云的主要操作区域,可以查看、选中、新建、删除、修改对象。标注对象和街景中的选中对象是联动标注的。①3D模式下的操作:包括拖动整个3D空间、旋转视角、选中和删除功能;②俯视模式下的操作:拖动俯视视角3D空间、旋转、选中、新建对象、移动对象和删除。(3)三视图用俯视图、正视图和侧视图去观察选中的对象。在三视图中可以移动和调整标注框,以便更加贴合。(4)属性区域用于修改选中对象的属性。数据标注时需要选择属性的类别,如车辆类型,不同的类别可能拥有不同的属性,如车辆颜色、种类,以及人的着装等。(5)对象列表区用来显示本条数据中已经标注的对象,前面是对象ID,后面是对象类别,这个同时也作为标签显示在主视图中。(6)帧控制区域该区域可以把整条数据置为无效,或者把当前帧设置为无效:可以手动输入帧序号进行跳转,或者下一帧、上一帧、下十帧、上十帧、第一帧和最后一帧的跳转,也可以点击下方帧号进行跳转。(7)状态栏状态栏对操作成功与否进行提示(8)快捷键3D点云标注工具已定义快捷键,如下图所示。其中,1键代表3D视图,2键代表俯视图,3键和4键不调整目标框的位置,只选择新的朝向。W、S、A、D、R、F键分别代表微调所选择的目标对象框的前后左右上下4个面,向扩大的方向调整,每次调整4厘米。Q和E代表微调所选择框的旋转角度,每次调整2度。以上就是关于3D点云数据标注的工具及使用,你学会了吗?

小当老师 2022-09-16 13:50:13

科普篇 | 3D点云数据标注简介及应用

点云,即“点”构成的“云”。一般来自激光雷达,也可以来自毫米波雷达,是利用激光雷达和雷达传感器生成的三维点的集合,可分为黑白和彩色两大类,如下图所示。点云数据(point cloud data)一般由激光雷达等3D扫描设备获取空间若干点的信息,一般包括XYZ位置信息、RGB颜色信息和强度信息等,是一种多维度的复杂数据集合。01//3D点云的获取方法(1)    双目视觉传感器:类似人的双眼,它是基于视差原理并由多幅图像获取物体三维几何信息的方法。双目立体视觉系统一般由双摄像机从不同角度同时获得被测物的两幅数字图像,或由单摄像机在不同时刻从不同角度获得被测物的两幅数字图像,并基于视差原理恢复出物体的三维几何信息,下图为双目视觉传感器实物图。上图中,左右两侧的摄像头共同构成了双目视觉传感器。(2)激光雷达:激光雷达(Light Detection And Ranging,LIDAR),是以发射激光束探测目标的位置、速度等特征量的雷达系统。其工作原理是向目标发射探测信号(激光束),然后将接收到的从目标反射回来的信号(目标回波)与发射信号进行比较,作适当处理后,就可获得目标的有关信息,如目标距离、方位、高度、速度、姿态、甚至形状等参数。激光雷达实物图如下图所示。(3)深度体感设备Kinect:深度体感设备Kinect是一款类似三维摄像机仪器,具有实时动作追踪、图像识别、声音录入及辨别等功能。左右两边镜头分别是红外线发射器和CMOS红外线摄影机,识别的是一个深度场。其中每个像素颜色深浅表示该点距离摄像头的远近,距离摄像头较近的颜色较亮和深,距离摄像头较远的颜色较暗。Kinect实物图如下图所示。02//3D点云应用(1)多视图三维重建:多视图重建是利用多张一个场景的不同视角图像来恢复出场景三维模型的方法,自然场景的多视图三维重建一直是计算机视觉领域的基本问题,有着广泛的应用。下图为多视图三维重建示意图。(2)三维同步定位与地图构建(Simultaneous Localization And Mapping,SLAM):主要用于解决移动机器人在未知环境中运行时定位导航与地图构建的问题,三维同步定位与地图构建示意图如下图所示。(3)三维目标检测:与二维图像相比,3D点云数据的优势在于能够很好地表征物体的表面信息和一些深度信息。另外,由于3D点云数据的获取来源较多,因此对3D点云数据的研究得以迅速增长,进一步促进了使用深度学习实现3D点云目标检测,下图为三维目标检测示意图。(4)三维语义分割:三维(3D)语义分割在医学、自动驾驶、机器人和增强现实(AR)等许多领域的广泛应用,下图为三维语义分割示意图。03//3D点云数据集(1)悉尼城市目标数据集:这个数据集包含用Velodyne HDL-64E LIDAR扫描的各种常见城市道路对象,收集于澳大利亚悉尼的中央商务区(CBD)。含有631个单独的扫描物体,包括车辆、行人、广告标志和树木等,下图为数据集样例。(2)大规模点云分类基准数据集:该数据集提供了一个大的自然场景标记的3D点云数据集,总计超过40亿点。涵盖了各种各样的城市场景:教堂、街道、铁路轨道、广场、村庄、足球场、城堡等等。下图为数据集样例。(3)RGB-D对象数据集:该数据集是300个常见的家庭对象的大数据集。该数据集是使用Kinect风格的3D相机记录的,该相机以30Hz记录同步和对齐的640x480RGB和深度图像。下图为数据集样例。(4)纽约大学深度数据集:该数据集包括NYU-Depth V1数据集和NYU-Depth V2数据集,数据由来自各种室内场景的视频序列组成,这些视频序列由来自微软 Kinect的RGB和深度摄像机。下图为数据集样例。(5)KITTI标准数据集:该数据集利用KIT的无人车平台采集的大量城市环境的点云数据集(KITTI),这个数据集不仅有雷达、图像、GPS、INS的数据,而且有经过人工标记的分割跟踪结果,可以用来客观的评价大范围三维建模和精细分类的效果和性能,下图为数据集样例。以上就是关于3D点云数据标注的简介及应用,你学会了吗?

小当老师 2022-09-08 13:51:24