2023

Active Information Gathering Agent
June 11, 2023 RL Active Exploration Model-Based MuJoCo Chinese
本文系统梳理了主动信息收集智能体(Active Information Gathering Agent)的理论基础及其在RL场景下的算法框架,突出信息增益在policy中的作用及MuJoCo实验结果。
文献综述:AlphaGo系列文章调研
June 10, 2023 AlphaGo RL Survey Chinese
本文系统梳理了AlphaGo家族算法的原理、变革演进及扩展应用,涵盖AlphaGo到MuZero的发展主线及落地案例。
A Survey of Model-Based Reinforcement Learning
May 28, 2023 RL Survey Model-Based English
This survey reviews advances in model-based reinforcement learning (MBRL), summarizing model learning and policy optimization frameworks.

2022

从0开始看懂PPO
June 10, 2022 Chinese Research RL
简明介绍强化学习基础与PPO核心思想。

2021

Romeo and Juliet改编剧本
November 22, 2021 English Drama
大一暑假的莎剧小学期改编作品,演出效果非常好,剧组拿了很多奖,也包括最佳编剧(笑)。几乎全部照搬原文。
乐理之和声学(1)
November 12, 2021 Chinese Music Notes
谢鹏老师《即兴伴奏》前半学期课程内容整理。部分参考bilibili中BV14x411s7KZ教程。第二期施工可能会引入《调性和声》一书的内容。多图预警。