思维软件操作系统设计框架

来自通约智库
223.192.192.107讨论2019年8月5日 (一) 05:01的版本 (创建页面,内容为“{{4}}0.1web知识图谱web架构搭建 手动交互,存储,推荐功能,python 包:Anaconda 数据库Mysql mangodb IDE: pycharm Web架构:Django 附加...”)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索

0.1web知识图谱web架构搭建

手动交互,存储,推荐功能,python 包:Anaconda 数据库Mysql mangodb IDE: pycharm Web架构:Django


附加功能 a.(jQuery鼠标互动的网站小人)

b.数据私有化ipfs python API

学习starfire 做ipfs(https://github.com/b3log/starfire)

关注(使用 Solid 私有化存储 IPFS 文件哈希https://www.v2ex.com/amp/t/516150 https://github.com/Eximua/solid-ipfs)

2.0问答chatbot交互

3.0app视觉语音交互

4.0主动交互



一、推理网络 简单化实现 REFO: Regular Expressions for Objects 在冷启动一段时间,获得了一定用户使用数据之后,我们可以考虑引入其他的方法来改善系统的性能,然后逐渐减少正则规则在整个系统中的比重 库:jena,useki,中文RDF:OPENKG D2RQ SPARQL endpoint

二、数据存储----图数据库 (1) 数据存储内容 及格式 (数据存储支持、数据操作和管理方式、支持的图结构、实体和关系表示、查询机制) 原则:基础存储 可按数据场景选择使用关系数据库、NoSQL数据库及内存数据库。 基础存储保证可扩展、高可用 数据分割 基本类型:整数表、浮点数表、日期类型表、… 集合类型:List型表、Range型表、Map型表、… 属性表:依据数据类型划分 大属性单独列表:例如数量超过10M的属性单独列表 缓存与索引 SPO、SOP、PSO、POS、OSP、OPS SPO、POS、OSP 使用分布式 Redis 作为缓存,按需对数据进行缓存。 对三元组表按需进行索引,最多情况下可建立九重索 善于使用现有成熟存储 使用ElasticSearch实现数据的全文检索 结构固定型的数据可使用关系数据库或NoSQL 对于非关系型的数据尽量不入图存储,避免形成大节点 非关系型的数据,使用适合的数据存储机器进行存储,通过实体链接的方式实现与图谱数据的关联。 不直接在图存储中进行统计分析计算 对于需要进行统计分析计算的数据,需要导出到合适的存储中进行。

(2)数据类型 知识图谱时态信息及存储(时态数据库TDSQL) 事实的生成时间 某事实的有效时间段 某一对象在特定历史时刻的状态 知识图谱在过去特定时间的版本 关系型数据(通过关系形成网络) 关系型数据的存储方法:作为实体存入知识图谱,通过它们之间的关系形成图谱网络 结构型数据(与主体进行关联,但不会再续延伸) 结构型数据的存储方法:作为记录型数据存入合适的存储中,通过链接与图谱中的实体进行关联。 属性型数据 属性型数据的存储方法:作为实体的数值属性存入知识图谱 时态型数据 时态型数据的存储方法:使用基于知识图谱上的时间存储中间件进行存储和查询处理 Schema定义:概念选取, Schema定义:关系和属性的定义, 图数据库进行数据存储一般过程 使用图数据库进行数据存储一般过程: 导入实体,概念(Label) 导入实体属性 导入实体间关系 最佳实践过程: 分批导入,并使用Index提升导入时查询效率 按数据的类型、属性不同准备导入文件 数据主键维护,使用Constraints 尽可能保证导入数据格式正确

语料库搜集及建立常识库 �---�

这些概念当做每个记录标签,时间标签,然后在图数库存储这些标签当做实体 加上,可完成日记和日程管理