浮生无量摸鱼天尊 blog
摸一会鱼🐟
对齐到RL 一个未经对齐的 LLM 可能会产生无益、有害甚至有毒的内容,或者无法理解和遵循复杂、微妙的人类指令。 这一根本性问题被称为对齐(Alignment),即确保 AI 系统的目标和行为与人类的价值观和意图保持一致。 SFT(静态) 解决对齐问题的初步尝试是监督微调(Supervised Fi
首先要保证自己的IP是足够纯净的IP,开了v2ray/clash 之后,点开此网站,就能看到IP是否是原生IP且评分如何。 由于gemini和claude对IP的要求高,建议使用原生IP和高评分的节点,且长期只使用这个节点,不然可能会触发斩杀,
2023年至2025年的研究格局显示,通过将异构生理信号(EEG、fMRI、EMG、EOG、Gaze)与文本、视觉等高层语义模态进行深度融合,领域正在向大脑模型(Large Brain Models, LBMs)和多模态大模型(Large Multimodal Models, LMMs)迁移。 这种
递归递推 时间复杂度:看for的n,取最大 空间复杂度:看实际运行的时候用到了多少内存。 在递归算法中,每次递推都需要一个栈空间来保存调用记彔,因此在计算空间复杂度时需要计算递归栈的辅助空间。 对于递推和递归来说,其实是完全不同的两个思路 </
rag 的三个过程: 检索阶段:从外部知识库中提取任务相关的内容 整合阶段:对检索内容进行去重、冲突解决和重新排序 生成阶段:基于精选上下文进行推理以得出最终答案。 Paper note Towards Agentic RAG with Deep Reasoning: A Survey of RAG
agent范式 为了更好地组织智能体的“思考”与“行动”过程,业界涌现出了多种经典的架构范式。在本章中,我们将聚焦于其中最具代表性的三种,并一步步从零实现它们: ReAct (Reasoning and Acting): 一种将“思考”和“行动”紧密结合的范式,让智能体边想边做,动态调整。 Plan
阿里开放式多模态AI安全评测基准 OpenMMSec:百万开源多模态数据集
在矩阵的运算中,由于现在LLM Scaling Law,现在模型的矩阵相当的巨大。而计算单元的访存和算力有限,故此通常采用分治的思想进行并行计算,即采用分块的方式进行分块运算,这称之为tile,这里涉及到大量的程序编写的架构和编译器优化,后续我们会展开来这个说。 Matrix Transpose 矩
先说说我的看法,现在各种评价满天飞,我看了看README,其实很好说理解,首先肯定是OCR。 在README中提到两个文件,一个是对image进行OCR,一个是对PDF进行OCR。其最主要的功能就是将其文字和图片进行提取,然后改变为可执行对象。 其次就是对image进行理解,将其转为文字的描述,详细
Cuda API 创建对象: #include <cuda_runtime.h> #include <cuda.h> #include <iostream> #include <string> // 获取当前机器的GPU数量 cudaError_t error_id = cudaGetDevice