1.1 神经网络

深度学习与神经网络简介

深度学习 (Deep Learning) 通常指训练规模庞大（层数很深）的神经网络的过程。
神经网络 (Neural Network) 深度学习的核心组成部分，本笔记将介绍其基本概念。

简单示例：单特征房价预测

任务描述

目标：根据房屋面积预测价格
数据：6个房屋的面积和对应价格
挑战：需避免不合理的负值预测

方案迭代

初始尝试：线性回归
- 用直线拟合数据点
- 问题：直线可能延伸至负价格区域
改进方案：修正线性函数
- 定义函数：预测价格 = max(0, 线性预测值)
- 本质：这是最简单的神经网络雏形

神经网络基础：单神经元模型

结构组成

[输入 x] → (神经元) → [输出 y]

输入：房屋面积
神经元计算：
1. 线性运算
2. 通过ReLU激活函数：max(0, 计算结果)
输出：预测价格

ReLU激活函数详解

全称：Rectified Linear Unit
特性：
- 输入≥0时：线性输出
- 输入<0时：输出恒为0

扩展：多特征神经网络

输入层特征

特征名称	说明
Size	房屋面积
NBedrooms	卧室数量
Zip Code	邮政编码
Wealth	社区富裕程度

隐藏层自动学习概念

通过数据训练，网络可能自动发现：

家庭容纳能力（Size + Bedrooms）
步行便利性（Zip Code）
学区质量（Zip Code + Wealth）

网络结构示意图

[输入层4节点] → [隐藏层3节点] → [输出层1节点]

全连接特性：每层节点完全互连
自主学习：无需人工定义隐藏层含义

神经网络核心特性

层次结构

层级	功能
输入层	接收原始特征数据
隐藏层	通过非线性变换提取高阶特征
输出层	生成最终预测结果

训练过程

监督学习范式
- 输入：带标注的数据 (x→y)
- 输出：优化后的预测模型
应用场景
- 房价预测
- 图像识别（图→标签）
- 语音识别（音频→文本）