YYk'Blog - Read Me

Read Me

YYk'Blog

Call me if you need

Archives Tags Categories

YYk

Lv2

Categories

Posts

python备忘录

考虑到一些常用的python 函数与命令总是忘记，遂做备忘录以记录
2025-06-10
备忘录
笔记

| 备忘录

| python
Read morepython备忘录
Inference-Time Scaling for Generalist Reward Modeling 论文解读

解读 DeepSeek 团队提出的通用奖励模型 DeepSeek-GRM 及其推理增强方法 SPCT，结合自生成原则、评语与多轮采样，实现无需扩参的奖励质量提升
2025-05-28
论文解读

>

推理优化技术

| LLM
LLM

| 推理增强
Read moreInference-Time Scaling for Generalist Reward Modeling 论文解读
基于SASRec的序列推荐模型研究

基于SASRec的序列推荐模型研究
2025-05-22
项目

>

序列推荐
序列推荐

| 注意力机制
Read more基于SASRec的序列推荐模型研究
$Hoeffding 不等式的置信上界推导与 UCB/UCT 算法解读$
Hoeffding 不等式的置信上界推导与 UCB/UCT 算法解读

本文从 Hoeffding 不等式出发，推导出置信上界公式，并深入解析其在 UCB 与 UCT 算法中的应用
2025-05-12
数学

>

参数估计
数学

| 概率论

| 强化学习
Read moreHoeffding 不等式的置信上界推导与 UCB/UCT 算法解读
$Cross Entropy$
Cross Entropy

从信息论角度出发，解析交叉熵与 KL 散度的内在联系与应用
2025-05-09
数学

>

熵
数学

| 损失函数

| 概率论
Read moreCross Entropy
论文 - PromptKD: Unsupervised Prompt Distillation for Vision-Language Models

PromptKD 利用提示学习，在无需标签的条件下，将大型 CLIP 模型的知识高效迁移至轻量学生模型。通过复用教师类向量，仅训练图像提示和投影器，实现低成本蒸馏。
2025-05-04
论文解读

>

模型压缩

| 提示学习
知识蒸馏

| 提示学习

| 多模态
Read more论文 - PromptKD: Unsupervised Prompt Distillation for Vision-Language Models
论文 - Distilling the Knowledge in a Neural Network

《Distilling the Knowledge in a Neural Network》：神经网络中的知识蒸馏是 知识蒸馏（Knowledge Distillation) 这一领域的奠基性工作之一。
2025-05-03
论文解读

>

模型压缩
知识蒸馏

| 神经网络
Read more论文 - Distilling the Knowledge in a Neural Network
LeetCode: 行相等的多米诺旋转

LeetCode: 行相等的多米诺旋转
2025-05-03
LeetCode
LeetCode

| 算法

| C++
Read moreLeetCode: 行相等的多米诺旋转
初次见面

欢迎来到我的个人博客，这是基于 Hexo 搭建的。我期待着你的再次光临，也期待着明晨露珠的清新气息。

2025-05-02
Read more初次见面