陈海华:AI+人的技术实现 欢迎参与讨论

来自通约智库
跳转至: 导航搜索

来自: 陈海华 2019-08-05 18:04:21 完整文档 https://pan.wps.cn/l/sNBmm1Sli [文档] AI+人技术实现.docx

一、理论支撑及意义

陈海华 cenachen

知乎 https://www.zhihu.com/people/cenachen/activities

张靖 Timingtime

神经科学观点

1.embodiment具身化,连续性智能体-----创造智能机器也许还需要身体

Antonio Damasio神经科学家

为什么要研究意识及理解意识

http://c.open.163.com/mob/video.htm?plid=ME74OT7I6&mid=ME74PBN10#share-mob

SwiftKey联合创始人谈智能的基础:创造智能机器也许还需要身体

https://baijiahao.baidu.com/s?id=1562381304850853&wfr=spider&for=pc&sa=vs_ob_realtime&isFailFlag=1

2.自我 自传式记忆

《笛卡尔的错误》 10章关注身体脑181页神经系统中的自我 http://b.7dtime.com/B079L6XD8S/14/2.html

《Self comes to mind》

《感受发生的一切》摘录 (连续不断重新激活的神经网络,它是以一些聚合区为基础的,这些聚合区存在于颞叶和额叶的高级皮层、某些皮层下神经核团(包括部分杏仁核)。这些区域的同时激活与丘脑核团是同步的,也就是说,会对身体状态进行扰动(情绪反应),引起原始自我的改变,再经过原始自我与自传式表象的二级映射,形成核心意识https://www.cnblogs.com/lsgxeva/p/10047365.html)

《第二次成人研究初报》 胡爱生,刘巧燕

3.自我记忆内容

《笛卡尔的错误》 10章关注身体脑181页神经系统中的自我 http://b.7dtime.com/B079L6XD8S/14/2.html

正如我所看到的那样,自我的神经基础至少存在于两种表征的连续激活中。其中一组表征涉及个人自传体记忆中的关键事件,在此基础上,可以通过部分激活拓扑性质的感觉映射不断重建身份。描述我们一生的倾向性表征与大量分类事实有关,这些事实定义我们是谁:我们做了什么、我们喜欢什么、我们喜欢谁、我们使用什么类型的物体、我们经常去哪些地方、我们经常做什么。你可以将这组表征看成J.埃德加·胡佛(J. Edgar Hoover)所擅长收集的文件,除了一点,这些文件存在于大脑的关联皮层中,而不是在文件柜中。此外,除了这种分类之外,还有来自我们过去历史的独特事实,这些事实不断被激活为映射表征:我们生活和工作在哪儿、我们的工作是什么、我们自己的名字、近亲和朋友的名字、城市和国家的名字,等等。最后,在最近的倾向性记忆中,个体还收集了最近发生的事件,以及这些事件的大致时间,我们在记忆中还收集了一些计划,还有想象中我们打算做的事情或期望发生的事情。这些计划和虚构事件构成了我所说的“可能未来的记忆”,它就像其他任何记忆一样被置于倾向性表征中。

4.类hash结构 聚合区

《笛卡尔的错误》 10章关注身体脑181页神经系统中的自我 http://b.7dtime.com/B079L6XD8S/14/2.html

现在考虑以下几种可能性。首先考虑一下,大脑拥有第三组神经结构,这个结构既不是支持客体表象的结构,也不是支持自我表象的神经结构,而是与两者都相互关联。换句话说,这第三组神经元集合结构就是所谓的聚合区,是在脑皮层区域和皮层下核团中构建倾向性表征的神经基础。

接下来,假设当有机体被客体表象所扰动时,第三组神经元集合从客体表征和自我表征两者中接收信号。换句话说,当有机体对客体进行反应时,这第三组集合也在反应的过程中构建自我的倾向性表征。这种倾向性表征没有什么神秘之处,就是大脑擅长的有关储存、制作和重塑的那种表征,这并不奇怪。此外,我们知道大脑拥有所有必需的信息来构建这样一种倾向性表征:在我们看到一个客体并在早期的视觉皮层中形成表征后不久,各个躯体感觉皮层也形成了有机体对客体反应的其他许多表征。

我所设想的倾向性表征既不是那个小矮人创造的,也不是被它所觉知的,其他倾向性表征也是如此。在与之相关的早期感觉皮层中,倾向性表征有可能重新激活一种表象,即有机体针对特定客体的反应所生成的躯体感觉表象。

最后,考虑到上面我所描述的所有部分,即一个被表征的客体,对被表征客体作出反应的有机体,以及由于有机体对客体的反应而处于改变过程的自我的状态。这些同时被保持在工作记忆中,并在早期的感觉皮层中同时或交替出现。我认为,大脑不仅产生客体表象和有机体对客体反应的表象,还产生了第三种表象,即有机体对客体感知和反应时产生的表象。我相信主观性就来自第三种表象。

因此,要产生主观性,至少需要早期感觉皮层,包括躯体感觉,以及感觉和运动联合皮层。另外还有构成第三组集合的皮层下核团,特别是丘脑和基底神经节。

这种基础神经系统不需要语言。我所设想的元自我建构纯粹是非语言过程,是主要参与部分从另外两者的外部视角出发得出的概括性看法。实际上,这种第三方观点构成了一个非语言叙述文件,该文件记录着各参与部分每时每刻所发生的事。这种叙述可以在没有语言的情况下实现,而以感觉系统和运动系统在空间和时间上的基本表征为工具。我认为没有语言能力的动物也可以实现这个过程。

人类具有语言带来的二级叙事能力,可以从非语言叙述中产生语言叙述。我们精巧的主观性来自后者。语言可能不是自我的根源,但它肯定是“我”这个词的根源。

对另一个有关主观性的神经基础的解释我不是很熟悉,但是由于主观性是意识的一个关键特征,所以我需要简要提一下我的观点和其他人的观点有什么联系。

脑科学研究论证

1大脑的.时间戳

http://mip.mtrend.cn/news/35263.html

二、项目 、里程规划

0.1web知识图谱web架构搭建

手动交互,存储,推荐功能,python

包:Anaconda

数据库Mysql mangodb

IDE: pycharm

Web架构:Django

参考设计

http://www.doc88.com/p-5741707383184.html

基于知识图谱的个人知识管理平台的设计与实现-

附加功能

a.(jQuery鼠标互动的网站小人)

b.数据私有化ipfs python API

学习starfire 做ipfs(https://github.com/b3log/starfire)

关注(使用 Solid 私有化存储 IPFS 文件哈希https://www.v2ex.com/amp/t/516150

https://github.com/Eximua/solid-ipfs)

2.0问答chatbot交互

3.0app视觉语音交互

4.0主动交互

三、推理网络

简单化实现 REFO: Regular Expressions for Objects

在冷启动一段时间,获得了一定用户使用数据之后,我们可以考虑引入其他的方法来改善系统的性能,然后逐渐减少正则规则在整个系统中的比重

库:jena,useki,中文RDF:OPENKG

D2RQ SPARQL endpoint

四、数据存储----图数据库

(1) 数据存储内容 及格式

(数据存储支持、数据操作和管理方式、支持的图结构、实体和关系表示、查询机制)

1.原则:基础存储

1.可按数据场景选择使用关系数据库、NoSQL数据库及内存数据库。

2.基础存储保证可扩展、高可用

2.数据分割

1.基本类型:整数表、浮点数表、日期类型表、…

2.集合类型:List型表、Range型表、Map型表、…

1.属性表:依据数据类型划分

2.大属性单独列表:例如数量超过10M的属性单独列表

3.缓存与索引

1.SPO、SOP、PSO、POS、OSP、OPS

2.SPO、POS、OSP

1.使用分布式 Redis 作为缓存,按需对数据进行缓存。

2.对三元组表按需进行索引,最多情况下可建立九重索

4.善于使用现有成熟存储

1.使用ElasticSearch实现数据的全文检索

2.结构固定型的数据可使用关系数据库或NoSQL

5.对于非关系型的数据尽量不入图存储,避免形成大节点

1.非关系型的数据,使用适合的数据存储机器进行存储,通过实体链接的方式实现与图谱数据的关联。

6.不直接在图存储中进行统计分析计算

1.对于需要进行统计分析计算的数据,需要导出到合适的存储中进行。

(2)数据类型

知识图谱时态信息及存储(时态数据库TDSQL)

1.事实的生成时间

2.某事实的有效时间段

3.某一对象在特定历史时刻的状态

4.知识图谱在过去特定时间的版本

关系型数据(通过关系形成网络)

关系型数据的存储方法:作为实体存入知识图谱,通过它们之间的关系形成图谱网络

结构型数据(与主体进行关联,但不会再续延伸)

结构型数据的存储方法:作为记录型数据存入合适的存储中,通过链接与图谱中的实体进行关联。

属性型数据

属性型数据的存储方法:作为实体的数值属性存入知识图谱

时态型数据

时态型数据的存储方法:使用基于知识图谱上的时间存储中间件进行存储和查询处理

Schema定义:概念选取, Schema定义:关系和属性的定义,

(3)图数据库进行数据存储一般过程

使用图数据库进行数据存储一般过程:

1.导入实体,概念(Label)

2.导入实体属性

3.导入实体间关系

最佳实践过程:

1.分批导入,并使用Index提升导入时查询效率

2.按数据的类型、属性不同准备导入文件

3.数据主键维护,使用Constraints

4.尽可能保证导入数据格式正确