Geeks_Z の Blog Geeks_Z の Blog
首页
  • 学习笔记

    • 《HTML》
    • 《CSS》
    • 《JavaWeb》
    • 《Vue》
  • 后端文章

    • Linux
    • Maven
    • 汇编语言
    • 软件工程
    • 计算机网络概述
    • Conda
    • Pip
    • Shell
    • SSH
    • Mac快捷键
    • Zotero
  • 学习笔记

    • 《数据结构与算法》
    • 《算法设计与分析》
    • 《Spring》
    • 《SpringMVC》
    • 《SpringBoot》
    • 《SpringCloud》
    • 《Nginx》
  • 深度学习文章
  • 学习笔记

    • 《PyTorch》
    • 《ReinforementLearning》
    • 《MetaLearning》
  • 学习笔记

    • 《高等数学》
    • 《线性代数》
    • 《概率论与数理统计》
  • 增量学习
  • 哈希学习
GitHub (opens new window)

Geeks_Z

AI小学生
首页
  • 学习笔记

    • 《HTML》
    • 《CSS》
    • 《JavaWeb》
    • 《Vue》
  • 后端文章

    • Linux
    • Maven
    • 汇编语言
    • 软件工程
    • 计算机网络概述
    • Conda
    • Pip
    • Shell
    • SSH
    • Mac快捷键
    • Zotero
  • 学习笔记

    • 《数据结构与算法》
    • 《算法设计与分析》
    • 《Spring》
    • 《SpringMVC》
    • 《SpringBoot》
    • 《SpringCloud》
    • 《Nginx》
  • 深度学习文章
  • 学习笔记

    • 《PyTorch》
    • 《ReinforementLearning》
    • 《MetaLearning》
  • 学习笔记

    • 《高等数学》
    • 《线性代数》
    • 《概率论与数理统计》
  • 增量学习
  • 哈希学习
GitHub (opens new window)
  • 数学文章

    • Proximal Gradient Method
      • 数学知识
      • References
  • 《高等数学》
  • 线性代数
  • 概率论与数理统计
  • 矩阵
  • 分布
  • 数学
  • 数学文章
Geeks_Z
2022-08-16
目录

Proximal Gradient Method

数学知识

可导:即设y=f(x) 一个单变量函数, 如果y x=x0 左右导数分别存在且相等,则称y x=x0 可导。如果一个函数在x0 可导,那么它一定在x0 是连续函数。

可微:设函数y=f(x),若自变量在点x 改变量Δx 函数相应的改变量Δy 关系Δy=A×Δx+O(Δx),其中A Δx 关,则称函数f(x) 点x 微,并称A×Δx 函数f(x) 点x 微分,记作dy,即dy=A×Δx,当x=x0 ,则记作dy∣x=x0。

image-20210926112718662

与经典的梯度下降法和随机梯度下降法相比,近端梯度下降法的适用范围相对狭窄。对于凸优化问题,当其目标函数存在不可微部分(例如目标函数中有l1​ 范数或迹范数)时,近端梯度下降法才会派上用场。假设目标函数:

f(x)=g(x)+h(x)

其中,限定g(x) 是可微的凸函数、 h(x)​是不可微 (或局部不可微) 的凸函数。

Paper:

Proxλf(x)=argminyf(y)+λ2∥y−x∥2

Theory:

Proxλf(x)=argminy(f(y)+12λ∥y−x∥2)

从上面这个式子可以看出,上式是在寻找一个距离x 不要太远的一个y,使得f(x) 可能小,显然f(y)<=f(x)。最小化f(x) 要求新求得的y 不能和上一轮迭代得到的x 距离太远(泰勒公式通常只展开到一阶或二阶,高阶项被丢弃,要使得被丢弃的高阶项不至于对优化造成太大影响,下一个坐标点必须不能离原坐标点距离太大)。Proxλf(x) 点是最小化函数f 临近x 折中。

image-20210927161505329

这张图形象的表示了上面式子的几何意义,其中加粗的黑线表示作用域,浅色的黑线表示函数f 等高线,蓝色的点对应上面式子的x ,红色点表示最终求得的y 。在蓝色的点处计算Proxf,则为相应的红色点(在蓝色的点处估计其得到红色的点)。函数定义域中的三个点仍然在定义域中,并且移动到函数的最小值,同时,另外两个点移动到定义域的边界并且朝向函数的最小值。参数λ 制近端操作将点映射到函数f 最小值的程度,λ 越大,则映射后的点更接近最小值,λ 越小,则向最小值移动的步长越小。

References

Proximal Algorithms_机器学习的小学生-CSDN博客 (opens new window)

www.luolei.info/2016/09/27/proximalAlgo/ (opens new window)

上次更新: 2025/06/25, 11:25:50
《高等数学》

《高等数学》→

最近更新
01
帮助信息查看
06-08
02
常用命令
06-08
03
学习资源
06-07
更多文章>
Theme by Vdoing | Copyright © 2022-2025 Geeks_Z | MIT License
京公网安备 11010802040735号 | 京ICP备2022029989号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式