softmax函数python(1) - 芒果文档

📌 相关文章

📜 softmax函数python(1)

📅 最后修改于: 2023-12-03 15:20:10.787000 🧑 作者: Mango

Softmax函数介绍

在机器学习中，softmax函数是一种用于将向量映射到概率分布的函数。它通常用于将神经网络的输出转换为概率分布。

数学定义

给定向量$\mathbf{z}=(z_1,z_2,...,z_k)$，softmax函数将它映射到另一个向量$\sigma(\mathbf{z})=(\sigma(z_1),\sigma(z_2),...,\sigma(z_k))$，其中：

$$\sigma(z_i)=\frac{e^{z_i}}{\sum_{j=1}^ke^{z_j}}, \quad i=1,2,...,k$$

其中，$e$是自然对数的底数，$\sum_{j=1}^ke^{z_j}$是对所有向量元素进行求和。

Python实现

在Python中，可以使用NumPy库来实现softmax函数。以下是一个简单的实现：

import numpy as np

def softmax(z):
    """
    Compute softmax values for each row of input array

    Parameters:
    z: 2D numpy array

    Returns:
    softmax_output: 2D numpy array of same shape as input array
    """

    # Calculate softmax for each row of input
    exp_z = np.exp(z)
    softmax_output = exp_z / np.sum(exp_z, axis=1, keepdims=True)

    return softmax_output

在此实现中，我们传递一个2D的NumPy数组。我们对每个向量行计算softmax，并返回一个2D的NumPy数组，其形状与输入数组相同。

示例

下面是如何使用上面的softmax函数的示例：

z = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

softmax_output = softmax(z)

print(softmax_output)

输出结果如下：

[[0.09003057 0.24472847 0.66524096]
 [0.09003057 0.24472847 0.66524096]
 [0.09003057 0.24472847 0.66524096]]

我们可以看到，softmax函数将每个向量的元素映射到[0, 1]之间的值，并保证所有元素的和为1，因此softmax函数输出的结果可以解释为概率分布。

总结

通过softmax函数将神经网络的输出转换为概率分布，我们可以计算输出类别的概率，并用于分类问题。同时，softmax函数的实现也很容易，使用NumPy库即可。