以下是关于非结构化数据治理的相关信息:
在 AI 新产品方面:
JamGPT AI Debug 小助手:https://jam.dev/jamgpt
ChatGPT2D 用于生成二维知识图谱:https://www.superusapp.com/chatgpt2d/
Motörhead by metal 是用于 LLM 的开源内存和信息检索服务器:https://github.com/getmetal/motorhead
在网页抓取工具方面:
Hexomatic:https://hexomatic.com/
WebscrapeAI:https://webscrapeai.com/
Kadoa:https://www.kadoa.com/
在个人数据处理方面:
Bloks 可自动处理个人笔记、任务列表和会议记录:https://www.bloks.app/
Lettria 用于处理个人文本材料:https://www.lettria.com/
Quadratic 可使用 AI、Python、SQL 和公式分析个人数据:https://www.quadratichq.com/?ref=producthunt
在向量数据库方面,以电影网站为例,传统搜索在处理语义搜索和对非结构化数据(如图像、音频等)的相似性搜索时存在问题,比如用户输入“电影像《星球大战》一样令人兴奋”或上传一张电影《银翼杀手》的海报,传统关系数据库或 Excel 难以理解和返回相关搜索结果。
在金融行业,非结构化数据主要涉及报告(如年度报告、季度报告等公司财务报告)、公告(如董事会公告、监事会公告、股东大会公告等)、上市资料(如招股说明书等公司上市相关文件)。
2025-01-24