Chinese NER(Named Entity Recognition) using BERT(Softmax, CRF, Span)
Repositories
yangjianxin1 repositories
这里是改进了pytorch的DataParallel, 用来平衡第一个GPU的显存使用量
中文CLIP预训练模型
Easy-to-use CPM for Chinese text generation(基于CPM的中文文本生成)
ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型
中文LLaMA&Alpaca大语言模型+本地CPU部署 (Chinese LLaMA & Alpaca LLMs)
基于ClipCap的看图说话Image Caption模型
Let us control diffusion models
Firefly: 大模型训练工具,支持训练Qwen2.5、Qwen2、Yi1.5、Phi-3、Llama3、Gemma、MiniCPM、Yi、Deepseek、Orion、Xverse、Mixtral-8x7B、Zephyr、Mistral、Baichuan2、Llma2、Llama、Qwen、Baichuan、ChatGLM2、InternLM、Ziya2、Vicuna、Bloom等大模型
Firefly中文LLaMA-2大模型,支持增量预训练Baichuan2、Llama2、Llama、Falcon、Qwen、Baichuan、InternLM、Bloom等大模型
GPT2 for Chinese chitchat/用于中文闲聊的GPT2模型(实现了DialoGPT的MMI思想)
基于词汇信息融合的中文NER模型
LongQLoRA: Extent Context Length of LLMs Efficiently
transformers结构的中文OFA模型
使用Python复现SIGKDD2017的PAMAE算法(并行k-medoids算法)/The Python implementation of SIGKDD 2017's PAMAE algorithm (parallel k-medoids algorithm)
基于Scrapy的QQ音乐爬虫(QQ Music Spider),爬取歌曲信息、歌词、精彩评论等,并且分享了QQ音乐中排名前6400名的内地和港台歌手的49万+的音乐语料
Qwen2 is the large language model series developed by Qwen team, Alibaba Cloud.
对比学习 虾皮同款商品匹配
SimCSE有监督与无监督实验复现