知识产权信息化建设“十一五”规划(5)

2006-10-17 20:45 admin 中国电子政务网阅读 0

核心摘要： （二）加工内容和工作流程我局在“十一五”期间的信息资源加工将主要侧重在以下四个方面： 1、中、外专利基础数据库的建设，包括对中国专利申请数

　　（二）加工内容和工作流程

　　我局在“十一五”期间的信息资源加工将主要侧重在以下四个方面：

　　1、中、外专利基础数据库的建设，包括对中国专利申请数据和公开数据的格式转换和规范整合；对购买和引进的国外专利原始数据进行规范和整合，形成由文摘数据、代码化全文数据和全文图形数据三层结构组成的基础数据资源层，为我局的专利信息服务平台和无纸化专利审批系统提供基础数据支持。

　　2、对中、外专利文献外部特征的提取和处理，例如，法律状态数据、复审决定数据、同族专利数据、专利引文数据、机构代码等。

　　3、对中国专利进行全面深加工，包括对中国专利进行主题信息标引、专业分类和文摘重写；对重要专业领域进行特殊专业信息的标引，例如，基因序列、化学物质、族性化学结构、机械图形等；

　　4、对国外专利进行有限范围的深加工。根据经费情况，选择对我局专利审批和我国科技经济发展特别重要的领域，例如，生命科学、化工领域和材料科学等，做有限范围的深度专业加工，例如，基因序列、化学物质、族性化学结构等。

　　对中外专利专业信息深度加工的范围，可根据经费情况和实际需要适时进行调整。

　　信息资源加工的内容和流程见  “信息资源加工流程图”所示。

                                                              数据加工流程图

                （三）工作量及经费估算

                1、专利信息资源加工量统计（单位：万件，统计截止到2005年12月第一周）

              2、加工单价

　　3、信息资源加工费用估算（单位：万元)

                4、前期研发费用

              5、费用总计：（万元）  　　中国专利加工费：44350  　　国外专利加工费：42100  　　研发及管理等费用：19900  　　总计：106350万元

              （四）实施步骤及工作进度



　　1、2006年工作内容



　　（1）信息资源加工工作规范的建立



　　主要包括：基本数据格式标准的制定，数据加工标准的制定，专题数据库加工和建设标准的制定，标引规则和标引流程的制定，数据加工质量要求和质量控制体系的确立。



　　（2）数据初加工



　　a)  内部数据规范化：按照国际和国内相关数据标准对我局内部数据进行加工和规范整合，完成中国专利数据的规范和统一存储、管理等工作。



　　b)  外部数据的收集和整合：完成世界主要工业国家的专利数据收集，并按照我局整体数据规划和数据标准进行规范和整合。



　　c)  启动回溯申请文档的电子化和全文代码化工作和回溯数据的补齐工作。



　　（3）数据深加工



　　a)  启动我局主导的数据深加工，主要包括：按照IPC8对中国专利数据进行分类，重新撰写文摘，进行文摘翻译，并在2年内完成对追溯数据的加工。逐步建立中国专利文摘库（PAC）。对新申请中国专利的文摘数据处理，建议采用JPO的方式，从新申请受理后即开始进行文摘重新撰写，加工流程如下图所示：





　　文摘重新撰写，是对申请人撰写的文摘进行二次加工，将不规范的文摘按照要求改写成由技术要点、主要用途和有益效果组成的结构化文摘。经过重新撰写的、规范化、结构化的文摘有利于使用计算机进行辅助翻译。我局可以通过制订标准的方式，要求申请人提供符合我局要求的结构化标准格式的文摘。根据JPO的经验，申请人提供的文摘中，发现问题的文摘大约48％，需要重新改写的约为35％。



　　文摘翻译，对文摘的翻译可以聘用外部人员进行人工翻译，计算机辅助翻译将极大的提高翻译工作的效率，不断降低翻译的成本。根据日本专利局的统计数据，处理每年42万件专利申请文摘的翻译，需聘用500-800名兼职翻译人员。用于校对和管理的内部专职人员大约100人（其中一部分负责商标的处理）。



　　校对，经过重新撰写和翻译的文摘需要由我局工作人员进行校对，并进行质量检查，以确保数据的质量。



　　入库和公开，经过校对的数据进入中国专利文摘库（PAC），以便进行审批和公开。



　　b)  启动专题数据库试验库的建设，主要是对特殊专利领域的数据进行深度标引，建立多个领域的专题数据库试验库。



　　（4）数据池的建设



　　a)  管理系统开发，建立专利数据管理系统，对我局现有专利数据资源进行集中存储和管理。



　　b)  将馆藏光盘数据入库管理，将现有馆藏光盘入库，变手工管理为计算机辅助管理，建立相应的光盘信息库，降低专利文献馆藏光盘管理工作强度。



　　c)  扫描纸件、缩微平片文献入库，将现有的纸件、缩微平片文献扫描为电子件入库管理（可根据实际需求确定是否实施）。



　　d)  将基于数据库的数据装入系统，将现有数据库的数据提取形成原始数据入库管理。



　　2、2007年—2009年工作内容



　　（1）数据初加工



　　实时加工同步数据，同时对回溯数据进行加工。



　　（2）数据深加工



　　实时加工同步数据，同时对回溯数据进行加工。



　　（3）专题数据库建设



　　逐步完成专题数据库的建设工作，重点建设化工领域专利数据库、半导体材料数据库、通讯技术专利数据库、生物工程专利数据库、机械图形数据库等。建设专题专利数据库，主要加工内容包括数据的筛选、专业化分类和标引。制定科学严谨的标引规则和严格的质量控制体系，是专题数据库建设成功的基本保障。



　　（4）完成回溯申请数据电子化补齐工作



　　完成全部回溯申请数据电子化的补齐工作，2007年底之前完成所有回溯数据的补齐工作，2008年底之前完成所有回溯图形数据的代码化转换。



　　3、2010年工作内容



　　到“十一五”结束，基本完成数据加工的体系建设和回溯数据的加工工作，完善数据加工机制和质量控制体系，初步培育出数据加工市场，完成上述数据加工工作和相关数据库建设，进一步完善数据加工工作流程。到2010年，继续按照规范的数据加工工作规程实时加工同步数据，不断完善已建成的各种数据资源，进行更深层次的信息资源资源利用研究。



　　工作内容及进度见下表：





（五）保障条件



　　要保障“十一五”期间高效、优质的完成信息资源加工任务，必须全方位的保障条件，包括：1、组织保障；2、政策保障；3、标准保障；4、经费保障；5、基本数据保障；6、人员保障。



　　（六）实施方式



　　1、建立我局信息资源加工核心技术团队。该团队应该由我局各相关机构业务骨干共同组成，聘请部分社会上的专家作为技术顾问，共同研究制订我局的信息资源加工标准、工作流程、质量控制标准，建立计算机辅助的半自动标引体系、机器翻译系统、词表等各种辅助工具，为后续培训和组织实施进行技术准备和人才贮备。



　　2、对我局现有信息资源加工队伍进行整合并扩充，通过严格培训形成我局信息资源加工的基础队伍。



　　3、采用工业化装配作业方式，对信息资源加工任务进行分解，分项培训和实施，最后进行数据集成。分解作业可以提高工作效率，易于进行质量控制。



　　4、IPC分类工作由我局主导，自行组织完成。文摘撰写、范畴分类、主题标引可考虑选择我局主导、信息资源加工机构配合、适当引进社会力量参与等多种形式完成。专业信息的深度加工，也可考虑采用多种力量联合实施的方式完成。



　　5、信息资源加工的组织、实施，标准的研究、维护和修改完善等工作，必须有专门的机构进行负责，建议以整合后的信息资源加工队伍为基础，引进部分社会资金，联合成立商业化数据加工机构，以合同形式执行数据加工任务。“十一五”结束后，我局可停止对除IPC分类以外的其他数据深加工的经费投入，转而将形成的数据深加工产品的销售权授权该机构，我局作为数据库用户购买该机构的产品。这样，可以以该机构为基础，带动我国专利信息深加工产业的发展，以此为基础打造中国的德温特。



　　三、对中国专利信息资源的加工范围及内容



　　对中国专利信息资源的加工，包括初加工和深加工。



　　（一）初加工



　　包括纸件文档的电子化；图形文件OCR代码化；同族专利信息处理；专利引文、法律状态、公司代码等数据库的建立。具体工作如下：



　　1、纸件文档电子化和代码化



　　纸件文档电子化和代码化是专利审批流程无纸化的基础，目前我局已经将所有专利申请公开文档和公告文档电子化和代码化，此项工作在“十一五”期间将得到延续，按每年30万件增量，“十一五”期间将完成150万件公开文档的电子化和代码化。



　　此外，“十一五”期间将对所有申请文档进行电子化和代码化（包括回溯文档和新增文档），为我局专利审批无纸化作好数据准备，目前，未经加工的专利申请文档回溯数据量为260万件，按每年40万件递增，“十一五”末总数据处理量将达到560万件。



　　在“十一五”期间，随着电子申请系统和无纸化系统的进一步优化，电子文档的比例将逐渐上升，这将降低电子化和代码化数据处理的数量。



　　2、同族专利信息处理



　　目前，在中国专利申请中有相当比例的专利文献具有优先权信息，可根据优先权信息对专利进行同族聚类，建立世界范围的同族专利数据库（该库只是一个同族专利信息对照表，通过专利号与原始专利文献进行链接）。



　　3、专利引文标引



　　对专利文献中，专利审查员给出的引证文献和发明人给出的引证文献分别进行标引，建立世界范围的专利引文数据库。

TAGS: 决策信息平台十一五流程规划

发表评论

上一篇：王彦峰：论健康与生产力

下一篇：韩美共同进行防止皮肤老化的研究