
网站详情
基本信息
- 收录时间 2025-05-20
- 所属国家 中国
- 全球排名 #-
- 语言支持 中文
- 费用类型 免费 + 高级订阅
功能评分
标签分类
详情介绍
- 站点名称:近代汉语标记语料库
- 站点 URL:http://lingcorpus.iis.sinica.edu.tw/early/
- Title:近代汉语标记语料库 | 权威学术研究工具
- Keywords:近代汉语,语料库,标注,检索,学术研究,标记语料库,历史分期,分词检索,句法分析
- Description:中央研究院开发的近代汉语标记语料库,提供深度标注的历史文本,支持多维度检索与分析,是语言学家、研究者的权威工具。免费访问,涵盖唐五代至清末文献,助力汉语史研究与教学。
站点简介
该语料库不仅包含原始文本,更提供词语切分、词性标注、句法结构标注等深加工信息,支持用户通过关键词、词类、特征组合等方式精准检索。其技术架构采用分层标注体系,结合历时语言学理论,可满足从词汇到句法的多层次研究需求。
核心功能
1. 多维度检索系统
2. 深度标注与分析
3. 开放获取与资源整合
特点优势
1. 权威性与专业性
2. 技术创新性
3. 用户友好性
适用人群
- 语言学家与研究者:
- 研究近代汉语词汇、语法演变规律,如明清小说中的新词语产生机制。
- 利用标注数据验证语言学假设,如汉语趋向补语的语法化路径。
- 高校师生:
- 用于汉语史、方言学等课程的教学案例分析。
- 辅助学位论文撰写,如基于语料库的近代汉语句法对比研究。
- 数字人文从业者:
- 开发历史文本挖掘工具,如基于语料库的作者风格分析模型。
- 构建跨语言平行语料库,支持汉外对比研究(如汉英翻译史)。
- 古籍整理与出版机构:
- 校勘古籍文本,通过语料库检索验证异文的合理性。
- 编纂专题词典,如《近代汉语方言词典》,利用语料库提供真实用例。
使用指南
1. 快速检索
- 访问官网后,点击 “内容检索” 进入查询界面。
- 在 “关键词” 框输入检索词(如 “電”),选择 “整词匹配” 或 “模糊匹配” 模式,点击 “执行” 即可获取结果。
2. 高级检索
- 点击 “续设条件” 添加多个检索维度,如同时限定词类(如 “V”)和特征(如 “VRR”)。
- 使用 “词类选单” 选择细分词类(如 “Ne” 代表定词),或通过 “特征选单” 筛选特定语法功能(如 “述补结构”)。
3. 数据导出
- 检索结果支持生语料或标记语料格式下载,可选择 TXT 或 CSV 文件。
- 对于大规模数据需求,可提交申请获取全库文本(需通过学术合作渠道)。
4. 可视化分析
- 在 “进阶处理” 模块中,选择 “搭配分析” 生成词语共现网络,或 “历时统计” 绘制词频变化曲线。
- 导出图表时,可自定义坐标轴标签与图例,适配学术论文格式。
常见问题及解决方案
- 检索结果为空
- 原因:可能因关键词拼写错误或语料库未收录相关文本。
- 解决:
- 检查关键词是否包含特殊符号(如 “*” 需正确使用通配符)。
- 扩大检索范围,尝试 “模糊匹配” 或取消词类限制。
- 标注结果与预期不符
- 原因:近代汉语语法规则与现代汉语存在差异,可能导致标注歧义。
- 解决:
- 参考《近代汉语标记规范手册》调整检索条件(如结合上下文排除干扰项)。
- 联系技术支持团队提供具体用例,协助验证标注准确性。
- 数据下载失败
- 原因:网络不稳定或文件过大超出浏览器限制。
- 解决:
- 切换网络环境或使用下载工具(如 IDM)重试。
- 分批次下载数据,或申请通过 FTP 协议获取全库资源。
- 检索速度较慢
- 原因:复杂检索条件或大数据量查询导致服务器负载过高。
- 解决:
- 简化检索条件,如减少同时检索的词类或特征数量。
- 错峰使用系统,避免在高峰时段(如工作日上午)进行大规模查询。
相关产品推荐
- 国家语委现代汉语语料库(http://corpus.njau.edu.cn/)
- 特点:涵盖 1998 年至今的《人民日报》分词语料,支持实时更新与历时对比。
- 适用场景:现代汉语共时研究、新词新语追踪。
- 大地语料库(http://www.xn--cesp9b.net/)
- 特点:聚焦中日古代文献,提供联合检索与异体字识别功能。
- 适用场景:汉字文化圈语言对比、东亚历史文本挖掘。
- BCC 语料库(http://bcc.blcu.edu.cn/)
- 特点:包含文学、微博、科技等多领域语料,支持句法分析与历时统计。
- 适用场景:社会语言学研究、网络语言分析。
- Chinese-Annotator(https://github.com/Chinese-Annotator/Chinese-Annotator)
- 特点:开源中文标注工具,支持命名实体识别与关系抽取。
- 适用场景:自建语料库标注、机器学习模型训练。
- 中研院上古汉语标记语料库(https://languageresources.github.io/2018/05/25/)
- 特点:与近代汉语库同属中研院系列,提供先秦至西汉的标注语料。
- 适用场景:汉语史跨时代对比、语法化路径研究。
特色功能
AI图片生成
支持自由姿势的商品种草图生成,批量产出差异化、氛围感的商拍图
AI文案优化
基于商品信息自动生成高转化率的种草文案,适配不同平台风格
虚拟模特训练
提供丰富的商用AI模特库,支持用户训练专属虚拟模特形象
图片处理工具
集成一键美图、换装、去水印、高清修复等功能,快速提升图片品质
相关推荐

近代汉语标记语料库
http://lingcorpus.iis.sinica.edu.tw/early/
中央研究院开发的近代汉语标记语料库,提供深度标注的历史文本,支持多维度检索与分析,是语言学家、研究者的权威工具。免费访问...
西域行纪
http://www.kanji.zinbun.kyoto-u.ac.jp/~saiiki/
京都大学人文科学研究所「西域行纪」网站专注于西域历史文化研究,提供《大唐西域记》等核心文献的日本古抄本数字化资源、全文检...
用户评论 (2,348)
张伟
这是我用过最好的AI对话工具!写作助手功能太强大了,帮我节省了大量时间。特别是写报告和邮件时,它能快速生成高质量内容。
李婷
作为程序员,Copilot和ChatGPT是我每天必用的工具。ChatGPT在解释复杂概念和提供算法思路方面特别出色。强烈推荐!
王教授
我在教学中使用ChatGPT作为辅助工具,它能快速生成测验问题和解释复杂概念。但学生需要学会批判性思考,不能完全依赖AI的答案。