mindspore-courses · reeered · Feb 26, 2025
diff --git a/test/test_log_softmax.py b/test/test_log_softmax.py
@@ -0,0 +1,168 @@
+import mindspore as ms
+import mindspore.mint.nn.functional as F_mint
+import numpy as np
+import pytest
+import torch
+import torch.nn.functional as F_torch
+from mindspore import Tensor
+
+np.random.seed(42)
+ms.set_seed(42)
+torch.manual_seed(42)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_dtypes_support(mode):
+    """测试不同dtype输入的支持情况"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    ms_dtypes = [ms.int8, ms.int16, ms.int32, ms.int64, ms.uint8, ms.uint16, ms.uint32, ms.uint64, ms.float16, ms.float32, ms.float64, ms.bfloat16, ms.bool_]
+    torch_dtypes = [torch.int8, torch.int16, torch.int32, torch.int64, torch.uint8, torch.uint16, torch.uint32, torch.uint64, torch.float16, torch.float32, torch.float64, torch.bfloat16, torch.bool]
+
+    for i in range(len(ms_dtypes)):
+        ms_dtype = ms_dtypes[i]
+        torch_dtype = torch_dtypes[i]
+
+        x_np = np.random.randn(2, 3)
+
+        # PyTorch
+        torch_support = True
+        try:
+            x_torch = torch.tensor(x_np, dtype=torch_dtype)
+            _ = F_torch.log_softmax(x_torch, dim=1)
+        except Exception:
+            torch_support = False
+
+        # MindSpore
+        ms_support = True
+        try:
+            x_ms = Tensor(x_np, ms_dtype)
+            _ = F_mint.log_softmax(x_ms, dim=1).asnumpy()
+        except Exception:
+            ms_support = False
+
+        assert ms_support == torch_support, f"支持情况不同：ms_dtype: {ms_dtype} ({ms_support}), torch_dtype: {torch_dtype} ({torch_support})"''
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_fixed_dtype_accuracy(mode):
+    """固定dtype测试输出一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+
+    # PyTorch
+    x_torch = torch.tensor(x_np)
+    out_torch = F_torch.log_softmax(x_torch, dim=1)
+
+    # MindSpore
+    x_ms = Tensor(x_np, ms.float32)
+    out_ms = F_mint.log_softmax(x_ms, dim=1)
+
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_parameters(mode):
+    """测试固定shape，固定输入值，不同输入参数（string\bool等类型），两个框架的支持度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+    x_ms = Tensor(x_np, ms.float32)
+
+    dims = [None, 0, 1, -1, -2]
+    dtypes = [None, ms.float16, ms.float32, ms.float64]
+
+    params = [(dim, dtype) for dim in dims for dtype in dtypes]
+    for dim, dtype in params:
+        output = F_mint.log_softmax(x_ms, dim=dim, dtype=dtype)
+        assert output.dtype == (dtype if dtype else ms.float32), "输出类型不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_invalid_input(mode):
+    ms.set_context(mode=mode, device_target='Ascend')
+    """测试随机混乱输入，报错信息的准确性"""
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    x_ms = Tensor(x_np, ms.float32)
+
+    F_mint.log_softmax(x_ms)
+
+    with pytest.raises(ValueError) as excinfo:
+        F_mint.log_softmax(x_ms, dim=2)
+    print(excinfo.value)
+
+    with pytest.raises(TypeError) as excinfo:
+        F_mint.log_softmax(x_ms, dim=True)
+    print(excinfo.value)
+
+    with pytest.raises(TypeError) as excinfo:
+        F_mint.log_softmax(x_ms, dtype=True)
+    print(excinfo.value)
+
+    with pytest.raises(TypeError) as excinfo:
+        F_mint.log_softmax(x_np, dim=0)
+    print(excinfo.value)
+
+class TorchLogSoftmaxNet(torch.nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(3, 2)
+        self.linear.weight.data = torch.ones_like(self.linear.weight) * 0.5
+        self.linear.bias.data.fill_(0.1)
+
+    def forward(self, x):
+        return F_torch.log_softmax(self.linear(x), dim=1)
+
+class MsLogSoftmaxNet(ms.nn.Cell):
+    def __init__(self):
+        super().__init__()
+        self.linear = ms.nn.Dense(3, 2)
+        self.linear.weight.set_data(Tensor(np.full((2,3), 0.5), ms.float32))
+        self.linear.bias.set_data(Tensor([0.1, 0.1], ms.float32))
+
+    def construct(self, x):
+        return F_mint.log_softmax(self.linear(x), dim=1)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_network_forward(mode):
+    """测试网络正向传播一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+
+    # PyTorch
+    torch_net = TorchLogSoftmaxNet()
+    out_torch = torch_net(torch.tensor(x_np))
+
+    # MindSpore
+    ms_net = MsLogSoftmaxNet()
+    out_ms = ms_net(Tensor(x_np))
+
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "网络输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_network_backward(mode):
+    """测试网络反向传播梯度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    y_np = np.array([0, 1])
+
+    # PyTorch
+    torch_net = TorchLogSoftmaxNet()
+    loss_fn = torch.nn.NLLLoss()
+
+    x_torch = torch.tensor(x_np, requires_grad=True)
+    out_torch = torch_net(x_torch)
+    loss_torch = loss_fn(out_torch, torch.tensor(y_np))
+    loss_torch.backward()
+    grad_torch = torch_net.linear.weight.grad.detach().numpy()
+
+    # MindSpore
+    ms_net = MsLogSoftmaxNet()
+    loss_fn = ms.nn.NLLLoss()
+
+    def forward_fn(x, y):
+        logits = ms_net(x)
+        return loss_fn(logits, y)
+
+    grad_fn = ms.ops.value_and_grad(forward_fn, None, ms_net.trainable_params())
+    x_ms = Tensor(x_np)
+    y_ms = Tensor(y_np, ms.int32)
+    _, grads = grad_fn(x_ms, y_ms)
+    grad_ms = grads[0].asnumpy()
+
+    assert np.allclose(grad_ms, grad_torch, atol=1e-3), "权重梯度不一致"
+
diff --git a/test/test_mish.py b/test/test_mish.py
@@ -0,0 +1,135 @@
+import mindspore as ms
+import mindspore.mint.nn.functional as F_mint
+import numpy as np
+import pytest
+import torch
+import torch.nn.functional as F_torch
+from mindspore import Tensor
+
+np.random.seed(42)
+ms.set_seed(42)
+torch.manual_seed(42)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_dtypes_support(mode):
+    """测试不同dtype输入的支持情况"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    ms_dtypes = [ms.int8, ms.int16, ms.int32, ms.int64, ms.uint8, ms.uint16, ms.uint32, ms.uint64, ms.float16, ms.float32, ms.float64, ms.bfloat16, ms.bool_]
+    torch_dtypes = [torch.int8, torch.int16, torch.int32, torch.int64, torch.uint8, torch.uint16, torch.uint32, torch.uint64, torch.float16, torch.float32, torch.float64, torch.bfloat16, torch.bool]
+
+    for i in range(len(ms_dtypes)):
+        ms_dtype = ms_dtypes[i]
+        torch_dtype = torch_dtypes[i]
+
+        x_np = np.random.randn(2, 3)
+
+        # PyTorch
+        torch_support = True
+        try:
+            x_torch = torch.tensor(x_np, dtype=torch_dtype)
+            _ = F_torch.mish(x_torch)
+        except Exception:
+            torch_support = False
+
+        # MindSpore
+        ms_support = True
+        try:
+            x_ms = Tensor(x_np, ms_dtype)
+            _ = F_mint.mish(x_ms).asnumpy()
+        except Exception:
+            ms_support = False
+
+        assert ms_support == torch_support, f"支持情况不同：ms_dtype: {ms_dtype} ({ms_support}), torch_dtype: {torch_dtype} ({torch_support})"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_fixed_dtype_accuracy(mode):
+    """固定dtype测试输出一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+
+    # PyTorch
+    x_torch = torch.tensor(x_np)
+    out_torch = F_torch.mish(x_torch)
+
+    # MindSpore
+    x_ms = Tensor(x_np, ms.float32)
+    out_ms = F_mint.mish(x_ms)
+
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_invalid_input(mode):
+    """测试随机混乱输入，报错信息的准确性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    # 测试非Tensor输入
+    with pytest.raises(TypeError):
+        F_mint.mish(np.random.randn(2,3))
+
+    # 测试整型输入
+    with pytest.raises(TypeError):
+        F_mint.mish(Tensor(np.random.randint(0,5,(2,3)), ms.int32))
+
+class TorchMishNet(torch.nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(3, 2)
+        self.linear.weight.data = torch.ones_like(self.linear.weight) * 0.5
+        self.linear.bias.data.fill_(0.1)
+
+    def forward(self, x):
+        return F_torch.mish(self.linear(x))
+
+class MsMishNet(ms.nn.Cell):
+    def __init__(self):
+        super().__init__()
+        self.linear = ms.nn.Dense(3, 2)
+        self.linear.weight.set_data(Tensor(np.full((2,3), 0.5), ms.float32))
+        self.linear.bias.set_data(Tensor([0.1, 0.1], ms.float32))
+
+    def construct(self, x):
+        return F_mint.mish(self.linear(x))
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_network_forward(mode):
+    """测试网络正向传播一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+
+    # PyTorch
+    torch_net = TorchMishNet()
+    out_torch = torch_net(torch.tensor(x_np))
+
+    # MindSpore
+    ms_net = MsMishNet()
+    out_ms = ms_net(Tensor(x_np))
+
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "网络输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_network_backward(mode):
+    """测试网络反向传播梯度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+
+    # PyTorch
+    torch_net = TorchMishNet()
+
+    x_torch = torch.tensor(x_np, requires_grad=True)
+    out_torch = torch_net(x_torch)
+    loss_torch = out_torch.mean()
+    loss_torch.backward()
+    grad_torch = torch_net.linear.weight.grad.detach().numpy()
+
+    # MindSpore
+    ms_net = MsMishNet()
+
+    def forward_fn(x):
+        out = ms_net(x)
+        return out.mean()
+
+    grad_fn = ms.ops.value_and_grad(forward_fn, None, ms_net.trainable_params())
+    x_ms = Tensor(x_np)
+    _, grads = grad_fn(x_ms)
+    grad_ms = grads[0].asnumpy()
+
+    assert np.allclose(grad_ms, grad_torch, atol=1e-3), "权重梯度不一致"