如何通过Access批量将读取的信息与查行驶证信息图片和车辆发票图片合并在一起,生成PDF?

行驶证识别。接口说明本接口适用场景阿里云行驶证识别,是阿里云官方自研 OCR 文字识别产品,精准定位和识别行驶证正、副页所包含的关键信息,支持正副页在同一张图片的场景进行自动分割与结构化识别。
阿里云 OCR 产品基于阿里巴巴达摩院强大的 AI 技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
本接口图片示例
本接口核心能力分类概述多类型覆盖支持模糊、光照不均、透视畸变、任意背景等低质量图像识别。图像增强默认支持图像增强,包括图像自动旋转、畸变自动矫正、模糊图片自动增强等能力。行驶证混贴支持对正副页在同一张图片的场景进行自动分割与结构化识别。高精度识别总体准确率达 93%以上。如何使用本接口步骤概述1开通 车辆物流识别 服务。开通服务前后,您可以通过体验馆免费体验本功能识别效果。2购买行驶证识别资源包。本 API 会赠送免费额度,可使用免费额度测试。您也可以不购买资源包,系统会通过“按量付费”方式按实际调用量自动扣款。3可以参照调试页面提供的代码示例完成 API 接入开发。接入完成后,调用 API 获取识别结果。如果使用子账号调用接口,需要阿里云账号(主账号)对 RAM 账号进行授权。创建 RAM 用户的具体操作,请参考:创建 RAM 用户。文字识别服务提供一种系统授权策略,即 AliyunOCRFullAccess。具体授权操作,请参见在用户页面为 RAM 用户授权。重要提示类型概述图片格式本接口支持:PNG、JPG、JPEG、BMP、GIF、TIFF、WebP。暂不支持 PDF 格式。图片尺寸 图片长宽需要大于 15 像素,小于 8192 像素。 长宽比需要小于 50。 如需达到较好识别效果,建议长宽均大于 500px。 图片大小 图片二进制文件不能超过 10MB。
图片过大会影响接口响应速度,建议使用小于 1.5M 图片进行识别,且通过传图片 URL 的方式调用接口。 国家与语言本接口只支持中国行驶证。其他提示请保证整张行驶证内容及其边缘包含在图像内。
本能力会自动处理反光、扭曲等干扰信息,但会影响精度。请尽量选择清晰度高、无反光、无扭曲的图片。
相关能力 行驶证识别。
调试您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI
Explorer可以自动生成SDK代码示例。调试调试授权信息下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:操作:是指具体的权限点。访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。资源类型:是指操作中支持授权的资源类型。具体说明如下:对于必选的资源类型,用背景高亮的方式表示。对于不支持资源级授权的操作,用全部资源表示。条件关键字:是指云产品自身定义的条件关键字。关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。操作访问级别资源类型条件关键字关联操作ocr:RecognizeVehicleLicenseWrite无无请求参数名称类型必填描述示例值Urlstring否本字段和 body 字段二选一,不可同时透传或同时为空。
图片链接(长度不超 2048,不支持 base64)。
https://example.pngbodybyte否本字段和 URL 字段二选一,不可同时透传或同时为空。
图片二进制文件,最大 10MB。
使用 HTTP 方式调用,把图片二进制文件放到 HTTP body 中上传即可。
使用 SDK 的方式调用,把图片放到 SDK 的 body 中即可。
图片二进制文件返回参数返回参数说明字段类型说明dataobject结构化信息,正面为 face 字段,反面为 back 字段。sliceRectlist检测出的子图坐标信息。prism_keyValueInfolist结构化信息的坐标信息。ftypeint是否为复印件(1:是,0:否)。angleint图片的角度,0 表示正向,90 表示图片朝右,180 朝下,270 朝左。heightint算法矫正图片后的高度。widthint算法矫正图片后的宽度。orgHeightint原图的高度。orgWidthint原图的宽度。正面识别结果(face 字段)字段类型说明addressstring住址。engineNumberstring发动机号码。issueDatestring发证日期。modelstring品牌型号。ownerstring所有人。licensePlateNumberstring号牌号码。registrationDatestring注册日期。useNaturestring使用性质。vehicleTypestring车辆类型。vinCodestring车辆识别代码。issueAuthoritystring签发机关。反面识别结果(back 字段)字段类型说明licensePlateNumberstring号牌号码。inspectionRecordstring检验记录。passengerCapacitystring核定载人数。totalWeightstring总质量。curbWeightstring整备质量。permittedWeightstring核定载质量。overallDimensionstring外廓尺寸。tractionWeightstring准牵引总质量。energySignstring能源标志。recordNumberstring档案编号。remarksstring备注。barcodeNumberstring条形码编号。结构化坐标信息(prism_keyValueInfo 字段)字段类型说明keystring识别出的字段名称。keyProbint字段名称置信度。valuestring识别出的字段名称对应的值。valueProbint字段名称对应值的置信度。valuePoslist字段在原图中的四个点坐标(左上、右上、右下、左下)。示例正常返回示例JSON格式{
"RequestId": "43A29C77-405E-4CC0-BC55-EE694AD00655",
"Data": "{\"algo_version\":\"7a6241b9ccce3746da42ff09ee692b27721728bb\",\"data\":{\"face\":{\"algo_version\":\"1cef3d8e5c2d82e6180feca6bba3591559c2dc55\",\"angle\":0,\"data\":{\"address\":\"成都市龙泉驿区山泉镇联合村\",\"engineNumber\":\"8B213508\",\"issueDate\":\"2015-06-04\",\"model\":\"北京现代牌BH7164MX\",\"owner\":\"叶晴晴\",\"licensePlateNumber\":\"川A7809C\",\"registrationDate\":\"2008-07-08\",\"useNature\":\"非营运\",\"vehicleType\":\"小型轿车\",\"vinCode\":\"LBEHDAEB58Y038860\",\"issueAuthority\":\"四川省成都市公安局交通警察支队\"},\"ftype\":0,\"height\":293,\"orgHeight\":293,\"orgWidth\":427,\"prism_keyValueInfo\":[{\"key\":\"address\",\"keyProb\":100,\"value\":\"成都市龙泉驿区山泉镇联合村\",\"valuePos\":[{\"x\":79,\"y\":121},{\"x\":323,\"y\":125},{\"x\":322,\"y\":144},{\"x\":79,\"y\":139}],\"valueProb\":100},{\"key\":\"engineNumber\",\"keyProb\":99,\"value\":\"8B213508\",\"valuePos\":[{\"x\":201,\"y\":228},{\"x\":277,\"y\":230},{\"x\":277,\"y\":246},{\"x\":200,\"y\":244}],\"valueProb\":99},{\"key\":\"issueDate\",\"keyProb\":100,\"value\":\"2015-06-04\",\"valuePos\":[{\"x\":325,\"y\":266},{\"x\":419,\"y\":268},{\"x\":419,\"y\":286},{\"x\":324,\"y\":283}],\"valueProb\":100},{\"key\":\"model\",\"keyProb\":100,\"value\":\"北京现代牌BH7164MX\",\"valuePos\":[{\"x\":228,\"y\":159},{\"x\":398,\"y\":161},{\"x\":397,\"y\":180},{\"x\":227,\"y\":177}],\"valueProb\":100},{\"key\":\"owner\",\"keyProb\":100,\"value\":\"叶晴晴\",\"valuePos\":[{\"x\":80,\"y\":85},{\"x\":131,\"y\":85},{\"x\":131,\"y\":103},{\"x\":80,\"y\":103}],\"valueProb\":100},{\"key\":\"licensePlateNumber\",\"keyProb\":100,\"value\":\"川A7809C\",\"valuePos\":[{\"x\":81,\"y\":52},{\"x\":160,\"y\":52},{\"x\":160,\"y\":71},{\"x\":81,\"y\":71}],\"valueProb\":100},{\"key\":\"registrationDate\",\"keyProb\":100,\"value\":\"2008-07-08\",\"valuePos\":[{\"x\":175,\"y\":262},{\"x\":269,\"y\":265},{\"x\":269,\"y\":282},{\"x\":174,\"y\":278}],\"valueProb\":100},{\"key\":\"useNature\",\"keyProb\":100,\"value\":\"非营运\",\"valuePos\":[{\"x\":80,\"y\":155},{\"x\":135,\"y\":156},{\"x\":134,\"y\":175},{\"x\":79,\"y\":174}],\"valueProb\":100},{\"key\":\"vehicleType\",\"keyProb\":100,\"value\":\"小型轿车\",\"valuePos\":[{\"x\":268,\"y\":53},{\"x\":343,\"y\":56},{\"x\":342,\"y\":75},{\"x\":267,\"y\":73}],\"valueProb\":100},{\"key\":\"vinCode\",\"keyProb\":100,\"value\":\"LBEHDAEB58Y038860\",\"valuePos\":[{\"x\":215,\"y\":192},{\"x\":375,\"y\":196},{\"x\":375,\"y\":214},{\"x\":214,\"y\":209}],\"valueProb\":100},{\"key\":\"issueAuthority\",\"keyProb\":100,\"value\":\"四川省成都市公安局交通警察支队\",\"valuePos\":[{\"x\":17,\"y\":190},{\"x\":102,\"y\":190},{\"x\":102,\"y\":271},{\"x\":17,\"y\":271}],\"valueProb\":100}],\"sliceRect\":{\"x0\":0,\"y0\":0,\"x1\":427,\"y1\":0,\"x2\":427,\"y2\":293,\"x3\":0,\"y3\":293},\"width\":427}},\"height\":293,\"orgHeight\":293,\"orgWidth\":427,\"width\":427}",
"Code": "200",
"Message": "message"
}错误码访问错误中心查看更多错误码。变更历史变更时间变更内容概要操作2021-08-17OpenAPI 入参发生变更看变更集变更项变更内容入参OpenAPI 入参发生变更。新增入参:body
}
过去,我们在图书馆里找到一篇绝妙的文章,一段重要的参考资料,一本我们想存留的书籍,或者一个无法编辑的电子文档,要么选择手动抄录它,或者键入它并保存到计算机上,但如果一篇文章特别长,那就需要很多时间。随着OCR技术的诞生,我们可以自动识别处理文本,即使是很长文本的识别过程也要不了几秒钟,这极大地方便了信息录入,识别后的文本只需要进行少许文字修改和结构整理即可归档成电子文件。这些生活中的用例无一不说明了智能文档处理和OCR识别给能够为生活带来非常大的便利。然而,目前没有任何一款产品可以同时实现在多场景、多任务类型、多语言环境下高效稳定的处理。有些产品专注于文档处理和转换;有些产品可以很方便地对屏幕文本截图识别,但却无法处理手写文本;有些产品面面俱到却效果不佳。但今天我体验了一款给我带来惊艳的智能文档处理和OCR识别的产品平台,尽管之前对该平台的认识并不深刻,但它主页上写的为“扫描全能王”、“名片全能王”提供文字识别引擎引起了我充分的兴趣。TextIn (https://www.textin.com/),是合合信息旗下的一站式OCR服务平台,该平台根据不同的业务场景和需求,将产品分为了通用识别、票据识别、企业证照识别、车辆相关识别、个人证件识别、港澳台证件识别、海外证件识别、文档格式转换和图像处理等,满足各种客户的图像识别和文档处理需求。本次产品体验将评测TextIn中所有服务的重点应用场景。1. 通用识别TextIn平台的通用识别涵盖了文字识别、表格识别并转换、印章提取并检测、文档(图文表)识别、二维码识别等场景。我们只需要上传任意带有文字的图像,服务端识别后就会返回文字识别的结果。1.1. 文字识别文字识别是任何OCR产品的重中之重,在本次体验中,我分别用了四种姿势测评TextIn的性能。同时,我选用了鹅厂和熊厂的文字识别引擎做对比,看看究竟是哪一款好。普通横排文字识别测试图片:TextIn识别的结果:鹅厂熊厂TextInTextIn识别到的内容:
像海鸥和浪涛的欢聚一样,我们相遇相近。海鸥飞走了,浪涛滚滚向前,而我们也该做别离。Like the meeting of the seagulls and the waves we meet andThe seagulls fly off, the waves roll away and we depart.
在普通横排文字识别的测试中,熊厂和TextIn完整无误地识别出来了每一行,没有错行、漏字、错字的现象。鹅厂的效果最差,有串行现象。手写横排文字识别测试图片:TextIn识别的结果:鹅厂熊厂TextInTextIn识别到的内容:
再别康桥徐志摩轻轻的我走了,正如我轻轻的来,我轻轻的招手,作别西天的云彩。那河畔的金柳,是夕阳中的新娘,波光里的艳影,在我的心头荡漾。软泥上的青荇,油油的在水底招摇,在康河的柔波里,我甘心做一条水草。那榆荫下一潭,不是清泉,是天上虹,揉碎在浮藻间,沉淀着彩虹似的梦。
在手写横排文字识别的测试中,TextIn清晰无误地识别出来了每一行的所有手写字符,没有错行、漏字、错字的现象。鹅厂的效果最差,几乎全部乱码,熊厂识别出来了每一行,但是偶尔有错字。例如:
鹅厂:H篝心我定了.西加领经经函来熊厂:解多能我走了.正如我轻轻的来TextIn: 轻轻的我走了,正如我轻轻的来
普通竖排文字识别测试图片:TextIn识别的结果:鹅厂熊厂TextInTextIn识别到的内容:
例如,较旧的条目应该会有更完整的内容、更平衡的观点,而较新的条目可能经常会包含明显的错误、非百科全书的内容,或是单纯的破坏。
在普通竖排文字识别的测试中,TextIn可以完美识别每一列的字符,没有错行、漏字、错字的现象。鹅厂不能识别竖排文字,熊厂可以识别竖排文字,但是输出却是从左往右,也就是倒序的。而一般情况下竖排文字都是从右往左读,这有些不合理。例如:
鹅厂:破书明的更该坏的显条平会例。内的目衡有如…熊厂(按段落从左往右输出):明显的错误非…更平衡的观点…例如,较旧的条目应TextIn: 例如,较旧的条目应该会有更完整的内容…
多角度多国文字识别测试图片:TextIn识别的结果:鹅厂熊厂TextInTextIn识别到的内容:
ПриветT.Ahoj.Kaixo.Bunǎ.…(以下省略)
很显然,仅有TextIn可以识别每一种角度的所有语言的字符。鹅厂和熊厂都不能适应这种多角度多国文字的情况。以日语为例,鹅厂和熊厂都没能识别出日文字符,而TextIn可以识别出竖排的日文字符。1.2. 表格识别并转换对图片中的表格信息进行识别和转换,我没有用其他产品做对比,因为现有的能做这项工作的产品都是合合信息的,对比没有意义。通用表格识别TextIn支持识别图片/PDF格式文档中的表格内容,包括有线表格、无线表格、合并单元格表格,同时支持单张图片内的多个表格内容识别,返回各表格的表头表尾内容、单元格文字内容及其行列位置信息。例如有测试图片:TextIn识别到的内容:Textln 产品产品描述Textin Server API 文字识别产品通用文本识别、表格识别、卡证识别、票据识别、定制识别等识别产品Textin Mobile SDK 图像处理与文字识别SDK图像处理,文本、卡证、票据识别和信息提取移动端SDKTextln Studio 文字识别训练平台OCR自定义模版配置和机器学习训练平台Textin企业AI管理平台企业AI接入监控统计和渠道业务管理平台Textln 财报机器人财务报表智能分类、识别、提取、匹配、试算产品Textln 合同比对机器人财务报表智能分类、识别、提取、匹配、试算产品Textln 解决方案结合客户业务场景和Textin能力的场景解决方案2.简历等复杂表格TextIn识别到的内容:
RESUME简小丽23岁,现居广州135-0000-0000www.yjianli.com求职意向:办公室文员自我评价1.1年多办公室文员经验,熟悉公司所有内勤事务、人员的招聘离职及日常管理事务。熟悉行政文员事务管理工作程序。2.性格开朗,有较强组织和交际能力,能较好处理人际关系,合理地统筹安排生活和工作中的事务。3.拥有较强的沟通能力和适应能力、能承受工作压力、抗压能力强。4.能流利的使用粤语和基本的英语会话。
1.3. 印章提取并检测测试图片:TextIn识别到的内容:从识别结果可以看出,TextIn提供的印章检测功能可以识别并提出图像中的印章,以及辨认印章的所属单位。实际上不仅如此,TextIn还支持检测并识别多行业合同文件和票据中的印章,结构化返回票据等样本上单个/多个印章上文字,支持红章/黑章,常规印章(圆章/方章等),可控制印章切图外扩留白范围。1.4. 文档(图文表)识别仅仅对单图做识别是不够的,现在来整点高难度的活儿,我们对带有图文表的文档进行识别,看看效果怎么样。在这里,我们选用某知名国产办公软件的图片转文字工具作为对比。测试图片:TextIn识别的结果:知名国产办公软件TextIn在图片转文字\文档这个功能上,TextIn识别的的结果和*山国产办公软件几乎在同一水平线上,可以说不相上下。1.5. 二维码识别另外,TextIn还提供了二维码识别的功能,不过博客上发二维码会被吞图,这里直接给出TextIn的测试范例的识别结果,给大家做参考:TextIn对于在同一画面内的多个二维码可以做到分别识别,如“识别结果”中的1、2、3所示,我们只需要在返回的识别结果中选择我们需要的对应二维码的识别内容即可。2. 证照文本识别2.1. 个人证件身份证和二维码一样,发身份证也会被吞图,所以我们直接给出TextIn的demo上对身份证的识别结果,:TextIn可以对身份证正反面的全部字段进行结构化识别,包括姓名、性别、民族、出生日期、地址、身份证号、有效期限、签发机关,同时可返回头像切片位置信息,进行头像检测。然后返回结构化的识别结果,在某些情况,例如识别的后续任务是自动填写表单的时候,可以直接将识别结果赋值到表单中。驾驶证和身份证的识别一样,TextIn支持对驾驶证正副页全部字段进行结构化识别,包括姓名、类型、驾驶证证号、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有限期限始(至)、总计有效期限。例如我们对下面的测试图片进行识别:TextIn识别到的内容:字段名信息内容住址河北省邯郸市肥乡县肥乡镇出生日期1988-12-12准驾车型C1国籍中国记录档案编号初次领证日期2017-05-12发证机关北京市公安局公安交通管理局姓名王飞飞性别男类型中华人民共和国机动车驾驶证有限期始(至)2017-05-12至2023-05-12银行卡在使用各大银行的小程序和APP时,总是会要求填写银行卡号,我想想不少人都和我一样希望能够直接对银行卡进行拍照识别,所以我测试了TextIn对银行卡的识别能力:测试图片:返回的识别结果:字段名信息内容卡类型贷记卡卡号6225 7888 8888 8888有效期88/88持有人XIANG RI KUI发卡机构代号03080000卡号校验False可以看到,TextIn支持对银行卡中的6个关键字段的进行结构化识别,包括类型、发卡机构、发卡机构代号、有效期、卡号、持有人。更让我感到惊讶的是,在识别文本信息的同时TextIn还可以返回图像切边图像和定位点的位置信息,虽然这只是一个基础功能,但对于习惯保存卡片信息的人来说确实是很有帮助了,同样的功能还可以用在个人名片的拍照保存上。护照TextIn还支持对中国大陆护照个人资料页所有字段进行结构化识别,包括护照号码、姓名拼音、姓名、性别、出生日期、有效期、签发日期等14个字段。同样的,TextIn提供护照的切边头像及资料页切边图像。对于经常离境的朋友们来说,这个功能应该是比较实用的。测试图片:TextIn识别的的内容:护照号码G43243244姓陈/CHEN名小小/XIAOXIAO性别M出生地点湖北/HUBEI签发地点湖北/HUBEI出生日期10–2001有效期2020-10-10护照下方第一行PPPHHHHEN<<JIIIIII<<<<<<<<<<<<<<<<<<<<<<<<<护照下方第二行G494364200CHN0100101M201010101010101<<<<<<38签发机关公安部出入境管理局国家码CHN2.2. 车牌号老生常谈的OCR任务,车牌号识别,这几乎是判断一款OCR模型是否成熟的标杆。TextIn的文档指明了它支持单个或批量上传的多种类型车牌自动识别,包括蓝牌、黄牌、绿牌、警牌、使馆车牌等。于是我尝试一次性输入五张车牌号的图像,也就是输入了五组测试数据:车牌图像字段名信息内容普通蓝牌晋L90388新能源车----绿色京AD66266普通蓝牌浙AB0002白色*牌京A7726*普通单层黄牌渝BR9703我原以为TextIn只能识别车牌号,没想到还能根据车票颜色判断车牌类型。2.3. 海外证照多文字识别是TextIn的特色之一,从我个人的体验结果来说是很惊讶的。因为对于某些常用国家(例如:印度尼西亚、马来西亚、日本、菲律宾)的证件,TextIn不仅做到了文本的识别,还针对性的返回了结构化的信息。例如这张日本驾驶证:TextIn针对日本的驾驶证信息定义了一套结构化模板,识别的内容都套入模板后返回:字段名信息内容姓名緒小 小百百住所熊本県熊本市西区野中2丁目2-2古城ハイツ生日平成22年08月29日交付日期平成22年08月29日有效期平成36年06月19日个人番号9333878733333. 票据识别会计和财务人员非常需要票据识别的功能,但总是担心识别准确率的问题,因为错误的内容要比空白的内容更难处理。那么我们来试试TextIn对票据的识别效果:票据类型票据图片识别结果增值税发票国内通用票据混检(行程单、通用定额发票、火车票)车辆通行费票据从测试结果中可以看到,TextIn具有很高的识别准确率,几乎无误,而且可以同时识别多张票据。但同时,为了方便财务工作者筛查可能存在的错误,TextIn针对每种票据都定义了结构模板,依赖模板的文本提取可以保证及时发现并轻松地修改潜在的错误识别内容。总的来说,TextIn支持对多种票据类型(多票据)进行票据切分、票据分类、票据识别,同时支持在混贴报销场景下对多种票据检测以及关键信息提取,并返回结构化的文本信息。当前支持27种票据类型。4. 图像处理和PS检测4.1. 切边矫正和切边增强切边矫正和增强可以让文本内容聚焦,带来更好的展示(美观度)。更重要的是为下游任务(OCR识别,信息抽取等)带来准确率的提升。个人认为TextIn的切边增强功能十分强大,相较于其他类似产品如s**pro,虽然s*pro也可以进行切边矫正,但是会出现损毁变形,甚至因为角度而出现吞字漏字的情况。话不多说,直接上图:待切边图像切边矫正和增强后的图像从个人体验来说,TextIn的切边增强和弯曲矫正技术是独一无二的。参考论文 DocUNet(CVPR2018) 和 DewarpNet(ICCV2019) ,TextIn所用的文档矫正系统应用了一种基于偏移场学习的方法SOTA算法。4.2. 去除屏幕摩尔纹所谓摩尔纹,它主要是由于光的干涉引发的一种波纹现象。常见于对电脑屏幕的翻拍图像,去除屏幕纹是TextIn的特色技术之一,消除屏幕摩尔纹对提高图像、文字清晰度有巨大的促进作用的。使用TextIn去除屏幕摩尔纹的效果如下:测试图像 去除摩尔纹前测试图像 去除摩尔纹后效果很好,我好奇地看了一下TextIn的摩尔纹去除系统算法,找到一张框架图:虽然没有公布具体的实现细节,不过看起来像是构造了一种特殊的滤波器网络实现了摩尔纹的过滤,从大批量样本的测试结果来看,这个算法具有很好的泛化性,点赞。4.3. PS痕迹检测TextIn的PS痕迹检测是一个让我感到很惊艳的点,要知道通常检测图像是否被篡改只能通过Exif信息来检查,但如果图片只是经过PS,GMIP等图像编辑软件的格式改动,但未篡改具体内容的情况下容易误判,另外如果图片被篡改后,用第三方软件或工具抹除Exif信息,也会造成误判。TextIn通过自己提出的 CNN Tamper Detector 来检测RGB域和噪声域存在痕迹的篡改,例如擦除、擦除重打印文本、重打印文本、复制-移动、拼接等痕迹,同时融合SRM、BayarConv、ELA等方法提升CNN Tamper Detector性能,获得了很好的检测可靠性。另外,他们提出了 DCT Transformer Detector 用于检测频域存在痕迹的篡改,例如复制-移动、拼接等痕迹。
关于CNN Tamper Detector和DCT Transformer Detector的文献,可以在 CAT-Net(WACV2021) 和 Mantra-net(CVPR2019) 下载到。
那么效果究竟如何呢,我们来试试看效果:被篡改图像检测结果图像检测结果有篡改有篡改有篡改从测试结果来看,虽然TextIn标记的篡改位置不够准确,但都可以检测出有篡改痕迹。据我调查,目前并没有任何一款产品能够在图像篡改检测超越TextIn,希望之后TextIn能继续改进,争取早日做出更加完美的篡改检测系统。5. 文档格式转换TextIn提供了多种文档格式转换的工具,其中如Word转PDF、Excel转PDF等都是很成熟的功能,无需赘述。但现如今还没有任何一家的产品那个完美地实现 PDF转Word 和 PDF转Excel。在这里,我们将TextIn与某国产办公软件和口碑较好的PDF转换工具cle**pdf做个对比。5.1. PDF 转WordTextIn为用户提供了高并发高可靠的API,将PDF文档转换为Word。转换出的文件尽可能保持PDF原有格式,强化易读性。以如下待转换PDF为例:PDF转换为Word的结果:国产办公软件cle**pdfTextIn失败(只有一张不可编辑的图片)5.2. PDF 转ExcelTextIn为用户提供了高并发高可靠的API,将PDF文档转换为Excel。转换出的文件尽可能保持PDF原有格式,强化易读性。以如下待转换PDF为例:PDF转换为Excel的结果:国产办公软件cle**pdfTextIn失败(空表)可以看到,在PDF转换为Word的能力上,TextIn与某知名国产办公软件的转换能力在同一水平,但在PDF转换为Excel的能力上,TextIn在转换后含有更少的乱码。一个有意思的发现是,如果TextIn转换表格失败,那可以转用PDF转换为Word的功能,这时你会发现,TextIn能在Word中生成一张相当完整的表,之后我们再将该表从Word中复制到Excel中,就可以得到转换后的Excel表格了。6. API和文档支持那么TextIn到底如何使用呢?TextIn为广大的开发者提供了丰富的文档支持,例如当我们调用通用文本识别的API时,只需要一段简单的代码就可以实现,以PHP为例:<?php
/**
* Post请求
*
* @param string $url 地址
* @param array $headers Http Header
* @param string $body 内容
* @return string
*/
function post($url, $headers, $body) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_POSTFIELDS, $body);
$response = curl_exec($ch);
curl_close($ch);
return $response;
}
// 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-app-id
// 示例代码中 x-ti-app-id 非真实数据
const APP_ID = 'c81f*************************e9ff';
// 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-secret-code
// 示例代码中 x-ti-secret-code 非真实数据
const SECRET_CODE = '5508***********************1c17';
// 通用文字识别
const URL = 'https://api.textin.com/ai/service/v2/recognize';
$headers = [
'x-ti-app-id:' . APP_KEY,
'x-ti-secret-code:' .
APP_SECRET
];
$fileData = file_get_contents('example.png'); // 读取文件
$response = post(URL, $headers, $fileData);
$ocrResult = json_decode($response, true);
// 获取 身份证号 和 姓名
$result = $ocrResult['result'] ? $ocrResult['result'] : '';
if ($result)
{
$list = $result['item_list'];
if ($list && count($list))
{
var_dump($list);
}
}
图片上传后返回的内容记录在一个json包内,包括识别时间、图像角度和宽高、文本内容和类型,识别置信度等内容。我按照文档给出的示例代码对TextIn的77个API进行了逐一进行尝试,所有API都正常接收请求并返回处理结果。TextIn支持的77个API组织机构代码证识别自动除手写文字证件分类增值税发票识别营业执照识别印章检测识别印尼身份证识别银行卡识别银行回执单识别医疗证件票据分类行驶证识别香港身份证识别文档图像切边矫正卫生许可证识别完税证明识别图像水印去除图片切边增强通用文字识别通用机打发票识别通用表格识别通用NLP信息抽取台湾身份证识别台湾居民来往大陆通行证识别台湾健保卡识别税务登记证识别事业单位法人证识别身份证识别社保卡识别商铺小票识别日本驾驶证识别去屏幕纹票据分类名片识别马来西亚身份证识别开户许可证识别军官证识别卷式发票识别结婚证识别驾驶证识别机动车购车发票识别火车票识别护照识别户口本识别海关进出口货物报关单识别国内通用票据识别公路客运发票识别港澳台通行证识别港澳台居民居住证港澳居民来往内地通行证识别菲律宾身份证识别飞机行程单识别房产证识别发票验真二维码识别二手车购车发票识别定额发票识别电子承兑汇票识别出租车发票识别出生证明识别车牌号识别车辆通行费票据识别车辆合格证识别车辆登记证识别车辆VIN码识别不动产权证书识别办公文档识别澳门身份证识别PS检测Word转图片图片转WordPDF转WordPDF转ExcelPDF转PPTPDF转图片Word转PDFExcel转PDF图片转PDF
上海合合信息科技股份有限公司是行业领先的人工智能及大数据科技企业,致力于通过智能文字识别及商业大数据领域的核心技术、C端和B端产品以及行业解决方案为全球企业和个人用户提供创新的数字化、智能化服务。16年来深耕智能文字识别+商业大数据领域,在C端推出了多款深受全球用户喜爱的效率产品,例如:名片全能王、扫描全能王、启信宝等。在B端积极服务于AI+大数据赋能数字化转型,服务了超过30+个行业和2000+全球企业。
}

我要回帖

更多关于 查行驶证信息 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信