1、语言的本质
语言的本质
- 1.1 语言的产生
- 生物重演律
- 1.2 语言的本质
- 1.3 语系
- 1.4 文字的起源
- 汉字的构成和使用
- 后记
语言是人类传递信息的工具,其本质是信息的载体。
语音和文字是构成语言的两个基本属性,语音是语言承载的物理信号,文字是记录语言的逻辑符号。
1.1 语言的产生
人类语言的形成是生物演化、神经机制发展与社会文化需求协同作用的产物。语言的形成并非单一突变事件,而是经历百万年的渐进演化:从手势交流到发声优化,从具体指称到抽象表达,从个体认知到群体智慧。
人类早期社会生活中,人类通过简单的手势、表情和声音来传达信息。随着时间的推移,人类逐渐发现,某些特定的声音或手势能够与特定的事物或概念相对应。这种对应关系的建立,标志着语言符号的诞生。人们开始用这些符号来表达自己的意图和情感,从而使得交流变得更加准确和高效。
最初的文字符号也称为记事符号,几乎与语言形成于同一时期,但完整的文字系统应形成于语言之后。由于文字突破了语言的时空范围,所以文字并非从一开始就记录人们语言中的所有内容,而是有选择地记录一些对人们生产、生活比较重要的部分。大量的考古事实证明,文字的产生从氏族公社的记事开始,最初的文字符号记录了氏族群体的劳动和分配、祭祀和占卜等活动。
随着人们生产、生活的不断发展,文字也在不断发展,并且逐渐统一和规范,这是人类语言发展的共同规律。
生物重演律
生物发展史可以分为两个相互密切联系的部分,即个体发育和系统发展,也就是个体的发育历史和由同一起源所产生的生物群的发展历史,个体发育史是系统发展史的简单而迅速的重演(1866,E.haeckel 《普通形态学》)。儿童语言获得过程可以看做人类语言发展过程的浓缩性重演。
Moskowitz经过多年对儿童语言习得的研究和观察,将儿童语言称为“电报式言语”。他发现,“儿童语言的第一阶段,其句子最长只有一个词;其后的阶段最长句为两个词。”而这两个词基本上都是具体名词和动词。这种语言之所以叫作电报式的语言,是因为这些句子中没有功能‘词’,即没有动词时态词尾,没有名词复数词尾,也没有前置词、连词、冠词,等等。”
人类在单词句阶段的语言,严格意义上不能称为“语言”,它更像“动物的嚎叫”,动物也会通过嚎叫来发出信号,或者警示危险、或者宣誓主权、或者发现食物、或者表达情绪。而进入“双词句阶段”,相当于句子最初的形态,称为“指称一陈述”的分化阶段,此时最初的语言就萌芽了。“指称一陈述”的分化,意味着名词、动词、语法三者也逐步分化出来,语言就自然而然地诞生了。
1.2 语言的本质
物质、能量和信息是世界的三大基本构成,爱因斯坦说过:“质量就是能量,能量就是质量。时间就是空间,空间就是时间。” 而什么是信息呢,维纳说:“信息就是信息,既不是物质也不是能量。”
我国著名的信息学专家钟义信教授曾对信息给出如下定义:信息是事物存在方式或运动状态,以及这种方式或状态直接或间接的表述。简而言之,信息就是对事物存在和运动的表征。
存在和运动是事物最本质的属性,信息是反映了事物在特定时空中的物质与能量。
语言作为符号化的表达系统,要完整地表达任何一个客观的事物,必须既要有能力表达其存在特征,也要有能力表达其运动特征。单个的词只能表征事物的单一特性,或者是“存在”属性,或者是“运动”属性。语言想要完整地描述一个客观事物,并完整地传达出一个语义,就必须最少有两个不同性质的实词,形式如下: N ( 名词 ) + V ( 动词 ) N(名词)+V(动词) N(名词)+V(动词)或 N ( 名词 ) + A ( 形容词 ) N(名词)+A(形容词) N(名词)+A(形容词)其中,一个表征事物的“名”(存在的特征),另一个表征“动”或“形”(运动或属性的特征)。这自然而然地导致早期人类语言的用词在词性上的分化,称为“指称一陈述”分化。只有实现了“指称一陈述”分化,语言才能称为语言。
人类最初的语句带有很强的原始“指称一陈述”分化的痕迹,其表现形式多为**SV(主、谓)结构。随着语言发展越来越成熟,句子结构也变得越来越多样,形成了现代语言中最常出现的SVO(主、谓、宾)**型的句法模式。
人类语言作为信息传递的工具,语言形式(指称-陈述)、思维形式(本体-属性)和逻辑形式(主词-谓词)上三位一体的,具有高度一致性。
1.3 语系
世界上存在多种语系,这些语系是根据语言的演化关系,即语言之间在语音、词汇、语法等方面的对应特征和演变规律进行分类的。需要注意的是,语系的划分并不是绝对的,不同的语言学家可能会根据不同的分类标准和方法,得出略有差异的结果。
以下是目前普遍认可的主要语系:
(1)汉藏语系
- 分布:主要分布在中国、越南、老挝、泰国、缅甸、不丹、尼泊尔、印度、孟加拉国、柬埔寨等亚洲国家和地区。
- 特点:有声调,以虚词和语序作为表达语法意义的主要手段。
- 主要语言:汉语、藏语、缅甸语、羌语、嘉戎语、景颇语、彝语、傈僳语、拉祜语、哈尼语、白语、土家语、壮语、布依语、傣语等。
(2)印欧语系
- 分布:覆盖欧洲大部分地区、印度次大陆到伊朗高原,以及非洲、美洲等地区。
- 特点:语法变化和词汇变化丰富,包括格的变化、时态的变化等。
- 主要语言:英语、法语、德语、西班牙语、葡萄牙语、意大利语、俄语、印度语(如印地语、梵语)、波斯语、亚美尼亚语、阿尔巴尼亚语等。
(3)阿尔泰语系
- 分布:横跨欧亚的游牧民族,包括东北亚民族、日本、朝鲜等地。
- 特点:黏着语的特点,即通过在词根前后添加附加成分来构成新词或表示语法意义。
- 主要语言:蒙古语、突厥语(如土耳其语、哈萨克语)、满语、朝鲜语、日本语(部分学者认为日语属于阿尔泰语系,但争议较大)。
(4)闪含语系(又称亚非语系)
- 分布:主要分布在西亚和北非地区。
- 特点:具有凝聚性和字辅音体系,表达方式简洁。
- 主要语言:阿拉伯语、希伯来语、古埃及语、阿姆哈拉语等。
(5)乌拉尔语系
- 分布:主要分布在东欧的芬兰、匈牙利、爱沙尼亚等国家。
- 特点:语法结构相对简单,词汇和语法与印欧语系有一定的相似性。
- 主要语言:芬兰语、匈牙利语、爱沙尼亚语等。
(6)高加索语系
- 分布:主要分布在高加索地区,包括格鲁吉亚、阿塞拜疆、车臣等国家。
- 特点:语言之间差异较大,语法结构复杂,词汇丰富。
- 主要语言:格鲁吉亚语、阿塞拜疆语、车臣语等。
-
达罗毗荼语系
- 分布:主要分布在印度半岛中南部,包括斯里兰卡北部和巴基斯坦等地。
- 特点:具有独特的发音特点和词汇结构。
- 主要语言:泰米尔语、泰卢固语、马拉亚兰语等。
-
马来-波利尼西亚语系(又称南岛语系)
- 分布:主要分布在东南亚的岛屿、台湾岛、太平洋地区以及马达加斯加岛等地。
- 特点:重音节、开放音节和重音落后的共性特征。
- 主要语言:马来语、印尼语、菲律宾语、台湾南岛语族(如阿美语、泰雅语)、夏威夷语等。
-
南亚语系
- 分布:主要分布在东南亚半岛,包括缅甸、柬埔寨、越南、老挝等国家。
- 特点:语法和词汇上有其独特之处。
- 主要语言:高棉语、孟语、佤语等。
1.4 文字的起源
文字的本质是人类将思维外化的"体外存储器",文字区别于图绘或其他记事符号必须具有如下三个独立特征:约定的意义、基本固定的读音、基本一致的形式。简而言之,文字符号必须具备形、音、义的三者一致性。
(1)文字的前奏(约2万-5千年前)
- 结绳记事:原始部落用不同颜色、粗细的绳结记录猎物数量与部落大事,印加帝国的“基普”绳索甚至能记载赋税与历法数据。
- 壁画记事:约1.7万年前,法国拉斯科洞窟的野牛壁画,通过动物图像进行狩猎信息传递,不仅是艺术,更是狩猎仪式的“操作指南”。
- 刻划记事:6000年前,中国半坡遗址的陶器刻符,以简洁线条记录谷物数量,被郭沫若视为“汉字雏形”。
(2)文字的诞生(公元前3500年-公元前1200年)
-
楔形文字:泥板上的商业革命(3400BC,两河流域)
- 苏美尔人用芦苇杆在湿泥板上压出三角形刻痕,记录大麦交易与法律条文,现存3万块泥板中甚至包含史上首份离婚协议。
- 抽象化演进:从象形符号(如🐄表“牛”)到音节符号,开启文字表音化先河。
-
圣书体:尼罗河畔的永生密码(3100BC,埃及)
- 三大变体:庄严的碑刻圣书体、流畅的僧侣体、简化的世俗体,罗塞塔石碑的三语对照成为破译关键。
- 埃伯斯纸草书记载700种药方,证明文字如何推动医学系统化。
-
甲骨文:占卜裂痕中的文明之光(1600BC,中国)
- 王懿荣因“龙骨”入药偶然发现甲骨文,揭开商朝神秘面纱。15万片甲骨中,“妇好”之名重现女将军征伐羌方的史诗。
- 六书雏形:象形(日、月)、指事(上、下)、会意(武=止戈)已初具体系。
-
玛雅象形文:丛林中的星辰密码(300BC,中美洲)
- 800个符号编织复杂历法,精确计算金星周期,连现代天文学都为之惊叹。
(3)文字的演变(公元前1200年-公元21世纪)
- 公元前1200年左右,腓尼基人创造了22个字母的拼音文字系统。这种简化后的符号系统大大降低了学习难度,为拼音文字的发展奠定了基础。比布鲁斯古城出土的碑文证实了这一重要突破。
- 希腊人在公元前800年左右借鉴腓尼基字母,创造了希腊字母。这是欧洲文字的开端,后来的拉丁字母和斯拉夫字母都源于此。希腊字母的出现极大地促进了西方文明的发展。
- 汉字经历了漫长的演变过程。从甲骨文(公元前1600年)到金文(公元前1100年),再到小篆(公元前221年统一)、隶书(汉代)、楷书(魏晋),每一次变革都使汉字更加规范化和系统化。
汉字的构成和使用
汉代学者根据汉字的构成和使用方法归纳成六种模式,总称为六书,包括“象形”、“指事”、“会意”、“转注”、“假借”、“形声”。
(1)象形
“象形者,画成其物,随体诘诎,日月是也”。所谓的象形文字是把具体的物体以绘画的形式表现出来,形成文字。象形文字是早期人类对客观世界的一种最基本的编码方式,包含两种重要的机制:模仿和抽象。
(2)指事
“指事者,视而可识,察而见意,上下是也”。通常表示某种整体与局部的关系或者相对位置的概念。
(3)会意
“会意者,比类合谊,以见指撝,武、信是也”。将两个或两个以上的字组合起来,使之形成一个新字,其表示的含义也逐渐脱离了直观的自然界事物,引申为表达人们生产生活中的某种关系或活动,常用来表示某种行为或状态。
引申大体上可以分为隐喻和换喻,隐喻是一种通过文字(或语言)来完成的高级认知模式,它简化了大量描述新事物各种特征的细节,加快认知事物的速度。
(4)形声
“形声者,以事为名,取譬相成,江河是也”。使用语义和标声两个部分共同构成所造的新字。(现代汉语中的形声字已达到90%以上,成为最主要的汉语造字法)。
(5)转注
“转注者,建类一首,同意相受,考老是也”。用一个部首来表征部内的字,意义相同的字之间可以相互解释。该方法强制将语义相近的字(词)都归为一类,使用同一或相近的字形(偏旁部首)来构造。
(6)假借
“假借者,本无其字,依声讬事,令长是也”。为表达某一新事物,依据读音找一个音同或音近的现成字赋予其新的词义,用来表达该种事物,如外来词的中文译名。
后记
语言作为信息传递的工具,使人类能够团结协作,成为了地球的主宰。
引用赫拉利在《人类简史》中的原话:
智人之所以能征服世界,是因为有独特的语言。
Homo sapiens conquered the world thanks above all to its unique language.
相关文章:
1、语言的本质
语言的本质 1.1 语言的产生生物重演律 1.2 语言的本质1.3 语系1.4 文字的起源汉字的构成和使用 后记 语言是人类传递信息的工具,其本质是信息的载体。 语音和文字是构成语言的两个基本属性,语音是语言承载的物理信号,文字是记录语言的逻辑符…...
学习笔记:IC存储总结(ROM,RAM, EEPROM, Flash, SRAM, DRAM, DDL)
一,概述 半导体存储器是一种可以存储大量二值信息的半导体器件。在电子计算机及一些其他的数字系统的工作过程中,需要对大量的数据进行储存。由于数据处理的数据量和运算速度的要求,因此把存储量和存取速度作为衡量存储器的重要指标。 在电子…...
Scala:统计每个单词出现的个数并打印
目录 问题拆解: 解题步骤: 1. 拆分所有字符串为单词 2. 遍历所有单词并统计 3. 打印结果 基础版代码实现: 代码解释: 输出结果: 为什么这样设计? 继承的APP是个啥? 使用高阶函数式编…...
C++前缀和
个人主页:[PingdiGuo_guo] 收录专栏:[C干货专栏] 大家好,今天我们来了解一下C的一个重要概念:前缀和 目录 1.什么是前缀和 2.前缀和的用法 1.前缀和的定义 2.预处理前缀和数组 3.查询区间和 4.数组中某个区间的和是否为特定…...
图解MOE大模型的7个核心问题并探讨DeepSeekMoE的专家机制创新
原文地址:https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-mixture-of-experts #mermaid-svg-FU7YUSIfuXO6EVHa {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-FU7YUSIfuXO6EVHa .error-icon{fill…...
SpringBoot项目集成ElasticSearch
1. 项目背景 处于失业找工作的阶段,随便写写吧~ 没啥背景,没啥意义,Java后端越来越卷了。第一学历不是本科,感觉真的是没有一点路可走。 如果有路过的小伙伴,如果身边还有坑位,不限第一学历的话࿰…...
DeepSeek大模型深度解析:架构、技术与应用全景
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north 文章目录 一、大模型时代与DeepSeek的定位1.1 大模型发展历程回顾大模型发展历程时间轴(20…...
SQL AND OR 操作符详解
SQL AND & OR 操作符详解 在SQL(结构化查询语言)中,AND 和 OR 是两种非常重要的逻辑操作符,它们用于在查询条件中组合多个条件。理解并正确使用这些操作符对于编写有效的SQL查询至关重要。 引言 在处理数据库查询时,我们常常需要根据多个条件来筛选数据。AND 和 OR…...
Dubbo+Zookeeper
Apache ZooKeeper 通过当前页面下载Zookeeper 在这里启动zookeeper 可以根据这个页面简单学习一下,但是没有集成mysql,也会出现一些报错,且在这之后我们要使用的管理页面是vue的dubbo-admin dubbo学习三:springboot整合dubbozo…...
从源到目标:深度学习中的迁移学习与领域自适应实践
引言:数据驱动的智能时代与迁移挑战 在深度学习快速发展的今天,模型训练对数据量和质量的依赖成为核心瓶颈。面对新场景时,标注数据不足、数据分布差异等问题常导致模型性能骤降。迁移学习(Transfer Learning)与领域自…...
从厨电模范到数字先锋,看永洪科技如何助力方太集团开启数字新征程
在数字化洪流席卷全球的宏大背景下,企业转型升级的紧迫性与重要性日益凸显,成为驱动行业进步的关键引擎。在这一波澜壮阔的转型浪潮中,方太集团——厨电领域的璀璨明珠,以其前瞻性的战略视野和不懈的创新精神,携手数据…...
Redis大key
Redis大key基本概念,影响 Redis 大 key 指在 Redis 中存储了大量数据的键,它会对 Redis 的性能和内存管理产生影响。 大key的定义与value的大小和元素数量有关,但这个定义并不是绝对的,而是相对的,具体取决于系统的使用…...
在 Apache Tomcat 中,部署和删除项目
在 Apache Tomcat 中,部署和删除 WAR 文件是常见的操作。以下是详细步骤: 1. 删除 WAR 文件 (1) 停止应用 进入 Tomcat 的管理界面(默认地址:http://localhost:8080/manager/html)。 找到需要删除的应用,…...
前端基础之组件自定义事件
我们可以通过使用给组件绑定事件,当组件触发该事件时,就能进行值得返回 我们可以使用v-on属性来给子组件绑定自定义事件,此时该事件就会存在vc中,然后通过this.$emit来触发绑定的事件, 这样就能实现不需要app.vue来给子…...
在 Docker 中,无法直接将外部多个端口映射到容器内部的同一个端口
Docker 的端口映射是一对一的,即一个外部端口只能映射到容器内部的一个端口。 1. 为什么不能多对一映射? 端口冲突: 如果外部多个端口映射到容器内部的同一个端口,Docker 无法区分外部请求应该转发到哪个内部端口,会…...
基于DeepSeek(本地部署)和RAGFlow构建个人知识库
总结自视频(很强的小姐姐视频,讲解清晰明了):【知识科普】【纯本地化搭建】【不本地也行】DeepSeek RAGFlow 构建个人知识库_哔哩哔哩_bilibili 1. 背景 deepseek官方网页版也虽然很强,能够满足绝大部分需求…...
学习工具的一天之(burp)
第一呢一定是先下载 【Java环境】:Java Downloads | Oracle 下来是burp的下载 Download Burp Suite Community Edition - PortSwigger 【下载方法二】关注的一个博主 【BurpSuite 安装激活使用详细上手教程 web安全测试工具】https://www.bilibili.com/video/BV…...
2025-03-05 学习记录--C/C++-PTA 习题5-8 空心的数字金字塔
合抱之木,生于毫末;九层之台,起于累土;千里之行,始于足下。💪🏻 一、题目描述 ⭐️ 二、解题步骤 ⭐️ 下面以n5举例:🦋 第1步 🎀、外层循环(从1到…...
C++课程设计【宿舍管理查询软件】
宿舍管理查询软件 一、题目描述二、源码以及说明宿舍管理查询软件设计与实现1. 系统设计思路1.1 功能需求1.2 数据结构2. 系统实现3. 代码说明3.1 数据结构3.2 功能实现3.3 文件存储4. 示例运行输入输出5. 总结其他QT文章推荐一、题目描述 (一)问题描述 为宿舍管理人员编写一…...
Stable Diffusion模型采样方法与参数配置详解(含步数及画风适配表)
Stable Diffusion模型采样方法与参数配置详解(含步数及画风适配表) 以下为当前主流采样方法的性能对比及参数配置建议,结合显存占用、生成速度、适用场景等维度分类总结: 一、采样方法对比表 采样方法推荐步数显存占用生成速度…...
极狐GitLab 17.9 正式发布,40+ DevSecOps 重点功能解读【三】
GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料: 极狐GitLab 官网极狐…...
vue+neo4j 四大名著知识图谱问答系统
编号: D039 视频 vueneo4j四大名著知识图谱问答系统 技术架构 vuedjangoneo4jmysql技术实现 功能模块图 问答:基于知识图谱检索、支持图多跳、显示推理路径 姜维的师傅的主公的臣是谁: 马谡 知识图谱:四大名著总共4个图谱 红楼梦图谱 …...
【智能体架构:Agent】LangChain智能体类型ReAct、Self-ASK的区别
1. 什么是智能体 将大语言模型作为一个推理引擎。给定一个任务, 智能体自动生成完成任务所需步骤, 执行相应动作(例如选择并调用工具), 直到任务完成。 2. 先定义工具:Tools 可以是一个函数或三方 API也…...
基于eRDMA实测DeepSeek开源的3FS
DeepSeek昨天开源了3FS分布式文件系统, 通过180个存储节点提供了 6.6TiB/s的存储性能, 全面支持大模型的训练和推理的KVCache转存以及向量数据库等能力, 每个客户端节点支持40GB/s峰值吞吐用于KVCache查找. 发布后, 我们在阿里云ECS上进行了快速的复现, 并进行了性能测试, ECS…...
Vue的简单入门 三
目录 侦听器 watch 注意 表单输入绑定 v-model v-model修饰符编辑 lazy number Trim 模板引用 组件组成 组件引用三步走 组件的嵌套关系 header Main Aside Aritice Item App.vue组件引入三个子组件 组件的注册方式 全局注册组件的方法 (1) Vue 2 语…...
指纹细节提取(Matlab实现)
指纹细节提取概述指纹作为人体生物特征识别领域中应用最为广泛的特征之一,具有独特性、稳定性和便利性。指纹细节特征对于指纹识别的准确性和可靠性起着关键作用。指纹细节提取,即从指纹图像中精确地提取出能够表征指纹唯一性的关键特征点,是…...
使用wifi连接手机adb进行调试|不使用数据线adb调试手机|找应用错误日志和操作日志
手机在开发者选项里要开启无线调试 在手机设置中查看WiFi的IP地址 设置 -> WLAN -> 已连接的WiFi -> IP地址 使用手机的IP地址连接 adb connect 192.168.1.12:xxxxx 检查连接状态 adb devices 断开特定设备 adb disconnect 192.168.x.x:xxxxx 断开所有设备 …...
STM32——串口通信 UART
一、基础配置 Universal Asynchronous Receiver Transmitter 异步,串行,全双工 TTL电平 :高电平1 低电平0 帧格式: 起始位1bit 数据位8bit 校验位1bit 终止位1bit NVIC Settings一栏使能接受中断。 之前有设置LCD,…...
PHP fastadmin 学习
安装php环境安装mysql插件 修改 php.ini下载 phpstudy、fastadmin 错误 安装FastAdmin could not find driver 参考链接 安装插件 创建1.php <? phpinfo(); ?>运行 http://127.0.0.1/1.php 查看 POD 页面访问404 伪静态 Apache <IfModule mod_rewrite.c> O…...
Autojs无线连接vscode方法
1.获得电脑的IP 在电脑的CMD界面输入 ipconfig 然后找到ipv4的那一行,后面的即是你的电脑IP地址 2.打开vscode的autojs服务 安装autojs插件 在vscode界面按下ctrlshiftp 输入autojs 找到 点击 之后打开手机上的autojs 之后输入刚刚电脑上的地址 可以看到vsc…...
