1.1 神经网络

深度学习与神经网络简介

  • 深度学习 (Deep Learning) 通常指训练规模庞大(层数很深)的神经网络的过程。
  • 神经网络 (Neural Network) 深度学习的核心组成部分,本笔记将介绍其基本概念。

简单示例:单特征房价预测

任务描述

image-20250401115055419
  • 目标:根据房屋面积预测价格
  • 数据:6个房屋的面积和对应价格
  • 挑战:需避免不合理的负值预测

方案迭代

  1. 初始尝试:线性回归
    • 用直线拟合数据点
    • 问题:直线可能延伸至负价格区域
    • image-20250401115116492
  2. 改进方案:修正线性函数
    • image-20250401115137356
    • 定义函数:预测价格 = max(0, 线性预测值)
    • 本质:这是最简单的神经网络雏形

神经网络基础:单神经元模型

结构组成

[输入 x] → (神经元) → [输出 y]
  • 输入:房屋面积
  • 神经元计算
    1. 线性运算
    2. 通过ReLU激活函数:max(0, 计算结果)
  • 输出:预测价格

image-20250401115246664

ReLU激活函数详解

  • 全称:Rectified Linear Unit
  • 特性
    • 输入≥0时:线性输出
    • 输入<0时:输出恒为0
  • 标准RELU激活函数图像

扩展:多特征神经网络

image-20250401115354522

输入层特征

特征名称说明
Size房屋面积
NBedrooms卧室数量
Zip Code邮政编码
Wealth社区富裕程度

隐藏层自动学习概念

通过数据训练,网络可能自动发现:

  • 家庭容纳能力(Size + Bedrooms
  • 步行便利性(Zip Code)
  • 学区质量(Zip Code + Wealth)

网络结构示意图

[输入层4节点] → [隐藏层3节点] → [输出层1节点]
  • 全连接特性:每层节点完全互连
  • 自主学习:无需人工定义隐藏层含义

神经网络核心特性

层次结构

层级功能
输入层接收原始特征数据
隐藏层通过非线性变换提取高阶特征
输出层生成最终预测结果

训练过程

  1. 监督学习范式
    • 输入:带标注的数据 (x→y)
    • 输出:优化后的预测模型
  2. 应用场景
    • 房价预测
    • 图像识别(图→标签)
    • 语音识别(音频→文本)