2023
Active Information Gathering Agent
June 11, 2023
RL
Active Exploration
Model-Based
MuJoCo
Chinese
本文系统梳理了主动信息收集智能体(Active Information Gathering Agent)的理论基础及其在RL场景下的算法框架,突出信息增益在policy中的作用及MuJoCo实验结果。
文献综述:AlphaGo系列文章调研
June 10, 2023
AlphaGo
RL
Survey
Chinese
本文系统梳理了AlphaGo家族算法的原理、变革演进及扩展应用,涵盖AlphaGo到MuZero的发展主线及落地案例。
A Survey of Model-Based Reinforcement Learning
May 28, 2023
RL
Survey
Model-Based
English
This survey reviews advances in model-based reinforcement learning (MBRL), summarizing model learning and policy optimization frameworks.
2022
2021
Romeo and Juliet改编剧本
November 22, 2021
English
Drama
大一暑假的莎剧小学期改编作品,演出效果非常好,剧组拿了很多奖,也包括最佳编剧(笑)。几乎全部照搬原文。
乐理之和声学(1)
November 12, 2021
Chinese
Music
Notes
谢鹏老师《即兴伴奏》前半学期课程内容整理。部分参考bilibili中BV14x411s7KZ教程。第二期施工可能会引入《调性和声》一书的内容。多图预警。