2023-10-30
10 月 29 日,有部分用户在社交平台上分享,ChatGPT Plus 正在测试原生文件上传、分析功能,可以通过文本问答的方式,对上传的 PDF 等数据文件进行提问、搜索。
例如,上传一份 50 页的员工手册 PDF 文件,然后向 ChatGPT 提问,能帮我总结一下手册的 5 个核心观点吗?;新入职员工触犯规则后,会遭遇哪些处罚?
其实,文件分析功能并不是最近才推出的,用户借助 ChatGPT 早期推出的第三方插件功能就能实现。但在性能、效率、海量数据上下文理解方面无法与原生相媲美。
如果加上此前 ChatGPT 推出的代码解析功能,用户通过问答方式就能根据上传的文件,直接生成可视化图表,这对于金融、市场、营销等业务人员帮助巨大。
无需编写任何一行代码,切换多个工具,在单一平台就能完成所有的数据分析和创建可视化数据图。
分享用户展示了 ChatGPT 的 PDF 分析功能:他上传了一份开源大语言模型 Mistral 7B 的说明文档,然后提问,用两句话总结一下这份 PDF 文档。
ChatGPT 回答:Mistral 7B 是一个 70 亿参数的大语言模型,在各种基准测试上优于现有模型,同时使用分组查询注意力和滑动窗口注意力提升性能。它是在 Apache 2.0 许可证下发布的,展示了高性能和高效的推理,特别是在推理、数学和代码生成任务中。
同样支持多轮深度提问模式,可以继续发问,Mistral7B 在 PIQA 基准中的测试评分比 Code llama 高多少?
另外一个重磅测试功能是,用户可以通过上传图片,在 ChatGPT 中进行 P 图。这个使用了 ChatGPT 最新发布的文生图模型 DALL·E 3,并展示了强大的语义理解能力。
例如,上传了一份金毛的图片,然后提问,让这只狗奔跑起来吧。
ChatGPT 的 P 图功能展示
上传一张水豚的图片,然后让其按照皮克斯的风格重新生成一下。
这种细腻的语义理解和图片控制功能比 Midjourney 还要简单方便。此外,OpenAI 还对其他功能进行了优化。
例如,用户不必从 GPT-4 下拉菜单中选择 “使用 Bing 浏览” 模式,ChatGPT 可以根据上下文猜测他们是否需要联网。
相关文章