2025 年主要初创企业类别、增长动力和地区业绩亮点
关于数据集
初创公司单行推介数据集
这是一个结构化的合成数据集,捕捉简洁的初创企业价值主张以及重要的公司元数据。它专为数据清理、探索性分析、NLP 任务(例如音高分类、关键词提取)以及投资组合分析项目而设计。该数据集包含真实的零值,以模拟现实世界的不完整性。
主要特点
- 3,069 行,15 列
- 针对行业和核心技术定制的单行推介
- 实际业务属性:融资阶段、团队规模、市场规模
- 混合数据类型(数字、分类、文本、URL)
- 数据清理实践中的故意缺失值
建议用例
- 初创企业推介中的文本挖掘和主题建模
- 从音调角度对行业和技术进行分类
- 资金/员工规模预测的特征工程
- 仪表板和报告(增长、行业分布)
- 数据质量检查和清理工作流程
列字典
柱子 | 类型 | 描述 |
---|---|---|
启动 ID | 整数 | 每个初创企业的唯一标识符 |
公司名称 | 细绳 | 初创公司的品牌或注册公司名称 |
行业 | 类别 | 初创领域(例如人工智能和机器学习、金融科技、健康科技、SaaS、电子商务) |
单线间距 | 细绳 | 简洁的价值主张,描述初创公司的产品 |
成立年份 | 整数 | 初创公司成立年份 |
总部位置 | 细绳 | 主要经营或注册所在地城市和国家 |
融资阶段 | 类别 | 当前融资生命周期阶段(例如种子轮、A-D 轮、IPO) |
最新资金金额(百万美元) | 漂浮 | 最新融资金额(百万美元)(可能包含空值) |
员工人数 | 整数 | 预计团队规模(可能包含空值) |
网站 | 细绳 | 公司官方网站网址(可能包含空值) |
LinkedIn_个人资料 | 细绳 | 公司 LinkedIn 页面 URL(可能包含空值) |
Twitter_Handle | 细绳 | 官方或品牌 Twitter/X 用户名(可能包含空值) |
CEO_姓名 | 细绳 | 首席执行官或创始人的姓名 |
核心技术 | 类别 | 主要技术重点(例如 AI、NLP、IoT、区块链、云) |
市场规模(十亿美元) | 漂浮 | 相关市场规模估算(单位:十亿美元)(可能包含空值) |
数据质量注意事项
- 为了方便清理任务,在选定的字段(资金、员工、URL)中故意存在空值。
- 行业和核心技术标准化,以实现一致的分析。
- 推介文本简洁明了,遵循商业沟通最佳实践,清晰且相关。
潜力分析
- 初创企业和技术的行业分布
- 融资阶段与员工人数的关系
- 推介的关键词频率和 n-gram 分析
- 市场规模细分和融资模式

资源下载
下载价格9.9 元
VIP免费
立即购买