1.我做了个chatPPT(含源码和prompt)
2.信息抽取UIE——基于prompt的实现信息抽取模型(附源码)
3.Selenium基础 — 浏览器弹窗操作
4.Langchain 源码分析 Chain系列(一)
我做了个chatPPT(含源码和prompt)
实现了一个基于AI的chatPPT工具,此工具能够根据输入的源码话题或句子自动生成PPT,包括润色标题、实现选择主题颜色以及生成所有插图。源码工具原理涉及openAI的实现GPT 3.5 TURBO接口、Dalle2以及Python-pptx库。源码探底冲顶指标公式源码
GPT 3.5 TURBO接口用于生成PPT结构文本,实现包括PPT标题、源码页面标题和内容等,实现同时根据文本内容选择适合的源码情感主题色彩。Dalle2则将生成的实现文本转化为相应的,Python-pptx库则负责构建PPTX文件。源码
实现这个工具的实现关键在于制定合适的提示语,让AI理解用户需求并生成符合预期的源码PPT。实现过程相对简单,实现但需要考虑科学上网、openAI接口费用(生成一个PPT费用约在0.1~0.2美元,主要成本来自接口)以及输出篇幅的语音agc算法源码限制。
使用时需要注意以下几点:
1、确保网络环境稳定,以便顺利使用工具。
2、openAI接口使用需付费,费用主要依据生成数量,一般生成一个PPT的费用在0.1~0.2美元左右。
3、由于AI接口限制输出最多个token,输出篇幅可能会受限。为解决这一问题,建议将用户输入内容分为多个部分,每次生成四个左右的主题,将这些主题的回复拼合,最终生成完整的PPT。虽然这样会增加成本,但可以有效解决输出限制问题。取存储过程源码
工具源码已提供,有兴趣的读者可自行下载和优化,以满足更多个性化需求。
信息抽取UIE——基于prompt的信息抽取模型(附源码)
信息抽取是NLP任务中的一个常见模块,旨在从自然文本中提取关键信息结构。通过例子理解,例如从"新东方烹饪学校在成都"中提取"新东方烹饪学校"与"成都"作为实体。
命名实体识别(NER)是提取词语级别的实体任务,而关系抽取(RE)则更进一步,关注实体之间的关系。序列标注(Sequence Labeling)方法通过为文本中的每个词分配类别标签,来实现信息抽取。
序列标注面临实体重叠问题,指针网络(Pointer Network)通过为每个实体单独预测解决此问题。它设计多头网络,为每个实体分别预测起始和结束位置,确保实体重叠问题得到解决。网络在线工具源码
UIE(基于prompt的指针网络)旨在提供更灵活的信息抽取方式。它通过引入prompt参数,允许模型在输入时激活与特定实体类型相关的参数,从而实现不同实体的抽取任务。此方法解决了模型结构随实体类型变化而变化的问题,同时可以高效处理实体关系抽取任务。
UIE的实现相对简洁,主要包含构建起始层和结束层,以及计算损失函数(BCE Loss)以优化模型。通过这种机制,UIE不仅简化了模型结构的调整,还提高了任务处理的灵活性和效率。
完整源码可供查阅,实现了一个高效且灵活的信息抽取解决方案,UIE展示了在信息抽取领域的创新与进步。
Selenium基础 — 浏览器弹窗操作
说明:在webdriver中,处理JavaScript生成的商城网站源码HTMLalert、confirm以及prompt弹窗非常简单。具体方法是通过switch_to.alert()方法定位到alert/confirm/prompt弹窗,然后使用text/accept/dismiss/send_keys方法进行操作。常用操作有:
示例:页面代码片段:
脚本代码:
注意:prompt弹窗输入框,Chrome不显示输入文本 Python版本 3.7.7
由于alert弹窗不够美观,现在大多数网站都会使用自定义弹窗。使用Selenium自带的方法无法处理这种情况,此时就需要使用JS方法进行处理。需求:去掉淘宝首页的自定义弹窗。淘宝首页的自定义弹窗如下:
提示:网页中弹出的对话框,也属于页面自定义弹窗,都可以用下面方式处理。实现方式:这种弹窗属于自定义弹窗的表现形式,可以通过设置HTML、DOM、Style对象中的一个display属性来处理,可以设置元素如何被显示。具体解释可以参考:/jsref/prop_style_display.asp。将display的值设置成none:此元素不会被显示,就可以去除这个弹窗了。注意:手动页面刷新之后还会出现弹窗。步骤如下:
提示:document.getElementById()是JS获取元素的方式,在JS获取元素方式中,只有ById()获取的是一个元素。其他获取元素的方式,都获取的是结果集,需要获取具体元素的时候,注意要使用索引。简单举例:
示例:
最后我这里给你们分享一下我所积累和真理的文档和学习资料,有需要是领取就可以了。
这个大纲涵盖了目前市面上企业百分之的技术,这个大纲很详细的写了你该学习什么内容,企业会用到什么内容。总共十个专题足够你学习。
这里我准备了对应上面的每个知识点的学习资料、可以自学神器,已经项目练手。
软件测试/自动化测试全家桶装学习中的工具、安装包、插件....
有了安装包和学习资料,没有项目实战怎么办,我这里都已经准备好了往下看。
如何领取这些配套资料和学习思路图,以及项目实战源码。这些资料都已经让我准备在一个php网页里面了,可以在里面领取扫码或者进Q群交流都可以暗号和备注是哦。
最后送上一句话:世界的模样取决于你凝视它的目光,自己的价值取决于你的追求和心态,一切美好的愿望,不在等待中拥有,而是在奋斗中争取。如果我的博客对你有帮助、如果你喜欢我的文章内容,请 “点赞” “评论” “收藏” 一键三连哦。
Langchain 源码分析 Chain系列(一)
Langchain是一个组件丰富的系统,其中"Chain"元素串联起prompt、memory、retrieval和model等组件,实现复杂功能。这些组件如prompt,能处理用户输入,大型模型提供反馈,反馈会被存储在memory中,供后续使用。Langchain提供了多种预设的chains以适应不同场景,也可根据需要自定义。
要入门,如LLMChain,它接收模板,格式化用户输入,通过LLM获取响应。创建一个水果描述的提示模板后,与LLM结合成简单的Chain,只需调用'run'方法,将获得对应水果特征的描述。run方法适用于单输入和单输出,且无需要额外输入字典。此外,chains模块还支持__call__方法,输出内容更灵活,可选返回仅输出项。
如果用聊天模型替换LLM,chains支持持久化数据的'Memory'参数,使chain具备状态,能存储和跨次调用保持信息。源码分析将深入探讨Chain、LLMChain和ConversationChain这三个核心类,它们在链式处理中起关键作用,各自带有抽象和具体方法,如prep_inputs预处理输入,prep_outputs验证输出,以及__call__作为执行入口点。
LLMChain是基于Chain的扩展,专门处理语言模型查询,如对话系统。它新增了特定于LLM的方法,简化处理过程。ConversationChain进一步扩展了LLMChain,支持对话和内存上下文管理。