From f15e24ece2368e5bdbc999f26b1e8db16f6e1906 Mon Sep 17 00:00:00 2001
From: reeered <1635970587@qq.com>
Date: Wed, 26 Feb 2025 17:04:08 +0800
Subject: [PATCH] =?UTF-8?q?=E6=B5=8B=E8=AF=95=E6=8E=A5=E5=8F=A3mindspore.m?=
 =?UTF-8?q?int.nn.functional.log=5Fsoftmax=E3=80=81mindspore.mint.nn.funct?=
 =?UTF-8?q?ional.mish=E3=80=81mindspore.mint.nn.functional.prelu=E3=80=81m?=
 =?UTF-8?q?indspore.mint.nn.functional.relu=E3=80=81mindspore.mint.nn.func?=
 =?UTF-8?q?tional.selu?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 test/test_log_softmax.py | 168 +++++++++++++++++++++++++++++++++++++++
 test/test_mish.py        | 135 +++++++++++++++++++++++++++++++
 test/test_prelu.py       | 149 ++++++++++++++++++++++++++++++++++
 test/test_relu.py        | 139 ++++++++++++++++++++++++++++++++
 test/test_selu.py        | 139 ++++++++++++++++++++++++++++++++
 5 files changed, 730 insertions(+)
 create mode 100644 test/test_log_softmax.py
 create mode 100644 test/test_mish.py
 create mode 100644 test/test_prelu.py
 create mode 100644 test/test_relu.py
 create mode 100644 test/test_selu.py

diff --git a/test/test_log_softmax.py b/test/test_log_softmax.py
new file mode 100644
index 0000000..630fcbf
--- /dev/null
+++ b/test/test_log_softmax.py
@@ -0,0 +1,168 @@
+import mindspore as ms
+import mindspore.mint.nn.functional as F_mint
+import numpy as np
+import pytest
+import torch
+import torch.nn.functional as F_torch
+from mindspore import Tensor
+
+np.random.seed(42)
+ms.set_seed(42)
+torch.manual_seed(42)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_dtypes_support(mode):
+    """测试不同dtype输入的支持情况"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    ms_dtypes = [ms.int8, ms.int16, ms.int32, ms.int64, ms.uint8, ms.uint16, ms.uint32, ms.uint64, ms.float16, ms.float32, ms.float64, ms.bfloat16, ms.bool_]
+    torch_dtypes = [torch.int8, torch.int16, torch.int32, torch.int64, torch.uint8, torch.uint16, torch.uint32, torch.uint64, torch.float16, torch.float32, torch.float64, torch.bfloat16, torch.bool]
+
+    for i in range(len(ms_dtypes)):
+        ms_dtype = ms_dtypes[i]
+        torch_dtype = torch_dtypes[i]
+        
+        x_np = np.random.randn(2, 3)
+        
+        # PyTorch
+        torch_support = True
+        try:
+            x_torch = torch.tensor(x_np, dtype=torch_dtype)
+            _ = F_torch.log_softmax(x_torch, dim=1)
+        except Exception:
+            torch_support = False
+        
+        # MindSpore
+        ms_support = True
+        try:
+            x_ms = Tensor(x_np, ms_dtype)
+            _ = F_mint.log_softmax(x_ms, dim=1).asnumpy()
+        except Exception:
+            ms_support = False
+
+        assert ms_support == torch_support, f"支持情况不同：ms_dtype: {ms_dtype} ({ms_support}), torch_dtype: {torch_dtype} ({torch_support})"''
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_fixed_dtype_accuracy(mode):
+    """固定dtype测试输出一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+    
+    # PyTorch
+    x_torch = torch.tensor(x_np)
+    out_torch = F_torch.log_softmax(x_torch, dim=1)
+    
+    # MindSpore
+    x_ms = Tensor(x_np, ms.float32)
+    out_ms = F_mint.log_softmax(x_ms, dim=1)
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_parameters(mode):
+    """测试固定shape，固定输入值，不同输入参数（string\bool等类型），两个框架的支持度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+    x_ms = Tensor(x_np, ms.float32)
+    
+    dims = [None, 0, 1, -1, -2]
+    dtypes = [None, ms.float16, ms.float32, ms.float64]
+
+    params = [(dim, dtype) for dim in dims for dtype in dtypes]
+    for dim, dtype in params:
+        output = F_mint.log_softmax(x_ms, dim=dim, dtype=dtype)
+        assert output.dtype == (dtype if dtype else ms.float32), "输出类型不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_invalid_input(mode):
+    ms.set_context(mode=mode, device_target='Ascend')
+    """测试随机混乱输入，报错信息的准确性"""
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    x_ms = Tensor(x_np, ms.float32)
+
+    F_mint.log_softmax(x_ms)
+
+    with pytest.raises(ValueError) as excinfo:
+        F_mint.log_softmax(x_ms, dim=2)
+    print(excinfo.value)
+
+    with pytest.raises(TypeError) as excinfo:
+        F_mint.log_softmax(x_ms, dim=True)
+    print(excinfo.value)
+
+    with pytest.raises(TypeError) as excinfo:
+        F_mint.log_softmax(x_ms, dtype=True)
+    print(excinfo.value)
+
+    with pytest.raises(TypeError) as excinfo:
+        F_mint.log_softmax(x_np, dim=0)
+    print(excinfo.value)
+    
+class TorchLogSoftmaxNet(torch.nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(3, 2)
+        self.linear.weight.data = torch.ones_like(self.linear.weight) * 0.5
+        self.linear.bias.data.fill_(0.1)
+    
+    def forward(self, x):
+        return F_torch.log_softmax(self.linear(x), dim=1)
+
+class MsLogSoftmaxNet(ms.nn.Cell):
+    def __init__(self):
+        super().__init__()
+        self.linear = ms.nn.Dense(3, 2)
+        self.linear.weight.set_data(Tensor(np.full((2,3), 0.5), ms.float32))
+        self.linear.bias.set_data(Tensor([0.1, 0.1], ms.float32))
+    
+    def construct(self, x):
+        return F_mint.log_softmax(self.linear(x), dim=1)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_network_forward(mode):
+    """测试网络正向传播一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    
+    # PyTorch
+    torch_net = TorchLogSoftmaxNet()
+    out_torch = torch_net(torch.tensor(x_np))
+    
+    # MindSpore
+    ms_net = MsLogSoftmaxNet()
+    out_ms = ms_net(Tensor(x_np))
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "网络输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_log_softmax_network_backward(mode):
+    """测试网络反向传播梯度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    y_np = np.array([0, 1])
+    
+    # PyTorch
+    torch_net = TorchLogSoftmaxNet()
+    loss_fn = torch.nn.NLLLoss()
+    
+    x_torch = torch.tensor(x_np, requires_grad=True)
+    out_torch = torch_net(x_torch)
+    loss_torch = loss_fn(out_torch, torch.tensor(y_np))
+    loss_torch.backward()
+    grad_torch = torch_net.linear.weight.grad.detach().numpy()
+    
+    # MindSpore
+    ms_net = MsLogSoftmaxNet()
+    loss_fn = ms.nn.NLLLoss()
+    
+    def forward_fn(x, y):
+        logits = ms_net(x)
+        return loss_fn(logits, y)
+    
+    grad_fn = ms.ops.value_and_grad(forward_fn, None, ms_net.trainable_params())
+    x_ms = Tensor(x_np)
+    y_ms = Tensor(y_np, ms.int32)
+    _, grads = grad_fn(x_ms, y_ms)
+    grad_ms = grads[0].asnumpy()
+    
+    assert np.allclose(grad_ms, grad_torch, atol=1e-3), "权重梯度不一致"
+
diff --git a/test/test_mish.py b/test/test_mish.py
new file mode 100644
index 0000000..87a6c29
--- /dev/null
+++ b/test/test_mish.py
@@ -0,0 +1,135 @@
+import mindspore as ms
+import mindspore.mint.nn.functional as F_mint
+import numpy as np
+import pytest
+import torch
+import torch.nn.functional as F_torch
+from mindspore import Tensor
+
+np.random.seed(42)
+ms.set_seed(42)
+torch.manual_seed(42)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_dtypes_support(mode):
+    """测试不同dtype输入的支持情况"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    ms_dtypes = [ms.int8, ms.int16, ms.int32, ms.int64, ms.uint8, ms.uint16, ms.uint32, ms.uint64, ms.float16, ms.float32, ms.float64, ms.bfloat16, ms.bool_]
+    torch_dtypes = [torch.int8, torch.int16, torch.int32, torch.int64, torch.uint8, torch.uint16, torch.uint32, torch.uint64, torch.float16, torch.float32, torch.float64, torch.bfloat16, torch.bool]
+
+    for i in range(len(ms_dtypes)):
+        ms_dtype = ms_dtypes[i]
+        torch_dtype = torch_dtypes[i]
+        
+        x_np = np.random.randn(2, 3)
+        
+        # PyTorch
+        torch_support = True
+        try:
+            x_torch = torch.tensor(x_np, dtype=torch_dtype)
+            _ = F_torch.mish(x_torch)
+        except Exception:
+            torch_support = False
+        
+        # MindSpore
+        ms_support = True
+        try:
+            x_ms = Tensor(x_np, ms_dtype)
+            _ = F_mint.mish(x_ms).asnumpy()
+        except Exception:
+            ms_support = False
+
+        assert ms_support == torch_support, f"支持情况不同：ms_dtype: {ms_dtype} ({ms_support}), torch_dtype: {torch_dtype} ({torch_support})"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_fixed_dtype_accuracy(mode):
+    """固定dtype测试输出一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+    
+    # PyTorch
+    x_torch = torch.tensor(x_np)
+    out_torch = F_torch.mish(x_torch)
+    
+    # MindSpore
+    x_ms = Tensor(x_np, ms.float32)
+    out_ms = F_mint.mish(x_ms)
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_invalid_input(mode):
+    """测试随机混乱输入，报错信息的准确性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    # 测试非Tensor输入
+    with pytest.raises(TypeError):
+        F_mint.mish(np.random.randn(2,3))
+    
+    # 测试整型输入
+    with pytest.raises(TypeError):
+        F_mint.mish(Tensor(np.random.randint(0,5,(2,3)), ms.int32))
+
+class TorchMishNet(torch.nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(3, 2)
+        self.linear.weight.data = torch.ones_like(self.linear.weight) * 0.5
+        self.linear.bias.data.fill_(0.1)
+    
+    def forward(self, x):
+        return F_torch.mish(self.linear(x))
+
+class MsMishNet(ms.nn.Cell):
+    def __init__(self):
+        super().__init__()
+        self.linear = ms.nn.Dense(3, 2)
+        self.linear.weight.set_data(Tensor(np.full((2,3), 0.5), ms.float32))
+        self.linear.bias.set_data(Tensor([0.1, 0.1], ms.float32))
+    
+    def construct(self, x):
+        return F_mint.mish(self.linear(x))
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_network_forward(mode):
+    """测试网络正向传播一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    
+    # PyTorch
+    torch_net = TorchMishNet()
+    out_torch = torch_net(torch.tensor(x_np))
+    
+    # MindSpore
+    ms_net = MsMishNet()
+    out_ms = ms_net(Tensor(x_np))
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "网络输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_mish_network_backward(mode):
+    """测试网络反向传播梯度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    
+    # PyTorch
+    torch_net = TorchMishNet()
+    
+    x_torch = torch.tensor(x_np, requires_grad=True)
+    out_torch = torch_net(x_torch)
+    loss_torch = out_torch.mean()
+    loss_torch.backward()
+    grad_torch = torch_net.linear.weight.grad.detach().numpy()
+    
+    # MindSpore
+    ms_net = MsMishNet()
+    
+    def forward_fn(x):
+        out = ms_net(x)
+        return out.mean()
+    
+    grad_fn = ms.ops.value_and_grad(forward_fn, None, ms_net.trainable_params())
+    x_ms = Tensor(x_np)
+    _, grads = grad_fn(x_ms)
+    grad_ms = grads[0].asnumpy()
+    
+    assert np.allclose(grad_ms, grad_torch, atol=1e-3), "权重梯度不一致"
diff --git a/test/test_prelu.py b/test/test_prelu.py
new file mode 100644
index 0000000..261cfb9
--- /dev/null
+++ b/test/test_prelu.py
@@ -0,0 +1,149 @@
+import mindspore as ms
+import mindspore.mint.nn.functional as F_mint
+import numpy as np
+import pytest
+import torch
+import torch.nn.functional as F_torch
+from mindspore import Tensor
+
+np.random.seed(42)
+ms.set_seed(42)
+torch.manual_seed(42)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_prelu_dtypes_support(mode):
+    """测试不同dtype输入的支持情况"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    ms_dtypes = [ms.int8, ms.int16, ms.int32, ms.int64, ms.uint8, ms.uint16, ms.uint32, ms.uint64, ms.float16, ms.float32, ms.float64, ms.bfloat16, ms.bool_]
+    torch_dtypes = [torch.int8, torch.int16, torch.int32, torch.int64, torch.uint8, torch.uint16, torch.uint32, torch.uint64, torch.float16, torch.float32, torch.float64, torch.bfloat16, torch.bool]
+
+    for i in range(len(ms_dtypes)):
+        ms_dtype = ms_dtypes[i]
+        torch_dtype = torch_dtypes[i]
+        
+        x_np = np.random.randn(2, 3)
+        weight_np = np.array([0.25], dtype=np.float32)
+
+        # PyTorch
+        torch_support = True
+        try:
+            x_torch = torch.tensor(x_np, dtype=torch_dtype)
+            _ = F_torch.prelu(x_torch, torch.tensor(weight_np, dtype=torch_dtype))
+        except Exception as e:
+            print(e)
+            torch_support = False
+        
+        # MindSpore
+        ms_support = True
+        try:
+            x_ms = Tensor(x_np, ms_dtype)
+            _ = F_mint.prelu(x_ms, Tensor(weight_np, ms_dtype)).asnumpy()
+        except Exception as e:
+            print(e)
+            ms_support = False
+
+        assert ms_support == torch_support, f"支持情况不同：ms_dtype: {ms_dtype} ({ms_support}), torch_dtype: {torch_dtype} ({torch_support})"''
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_prelu_fixed_dtype_accuracy(mode):
+    """固定dtype测试输出一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+    weight_np = np.array([-0.5, 0, 0.25, 1.5], dtype=np.float32)
+    
+    # PyTorch
+    x_torch = torch.tensor(x_np)
+    out_torch = F_torch.prelu(x_torch, weight=torch.tensor(weight_np))
+    
+    # MindSpore
+    x_ms = Tensor(x_np, ms.float32)
+    out_ms = F_mint.prelu(x_ms, weight=Tensor(weight_np))
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_prelu_invalid_input(mode):
+    ms.set_context(mode=mode, device_target='Ascend')
+    """测试随机混乱输入，报错信息的准确性"""
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    x_ms = Tensor(x_np, ms.float32)
+    
+    # 测试非Tensor输入
+    with pytest.raises(TypeError):
+        F_mint.prelu(np.random.randn(2,3), weight=Tensor(np.random.randn(2, 3)))
+        
+    # 测试weight不是Tensor
+    with pytest.raises(TypeError):
+        F_mint.prelu(x_ms, weight=np.random.randn(2,3))
+    with pytest.raises(TypeError):
+        F_mint.prelu(x_ms, weight=False)
+
+class TorchPReLUNet(torch.nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(3, 2)
+        self.linear.weight.data = torch.ones_like(self.linear.weight) * 0.5
+        self.linear.bias.data.fill_(0.1)
+    
+    def forward(self, x):
+        return F_torch.prelu(self.linear(x), weight=torch.tensor([0.25]))
+
+class MsPReLUNet(ms.nn.Cell):
+    def __init__(self):
+        super().__init__()
+        self.linear = ms.nn.Dense(3, 2)
+        self.linear.weight.set_data(Tensor(np.full((2,3), 0.5), ms.float32))
+        self.linear.bias.set_data(Tensor([0.1, 0.1], ms.float32))
+    
+    def construct(self, x):
+        return F_mint.prelu(self.linear(x), Tensor([0.25]))
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_prelu_network_forward(mode):
+    """测试网络正向传播一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    
+    # PyTorch
+    torch_net = TorchPReLUNet()
+    out_torch = torch_net(torch.tensor(x_np))
+    
+    # MindSpore
+    ms_net = MsPReLUNet()
+    out_ms = ms_net(Tensor(x_np))
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "网络输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_prelu_network_backward(mode):
+    """测试网络反向传播梯度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    y_np = np.array([0, 1])
+    
+    # PyTorch
+    torch_net = TorchPReLUNet()
+    loss_fn = torch.nn.NLLLoss()
+    
+    x_torch = torch.tensor(x_np, requires_grad=True)
+    out_torch = torch_net(x_torch)
+    loss_torch = loss_fn(out_torch, torch.tensor(y_np))
+    loss_torch.backward()
+    grad_torch = torch_net.linear.weight.grad.detach().numpy()
+    
+    # MindSpore
+    ms_net = MsPReLUNet()
+    loss_fn = ms.nn.NLLLoss()
+    
+    def forward_fn(x, y):
+        logits = ms_net(x)
+        return loss_fn(logits, y)
+    
+    grad_fn = ms.ops.value_and_grad(forward_fn, None, ms_net.trainable_params())
+    x_ms = Tensor(x_np)
+    y_ms = Tensor(y_np, ms.int32)
+    _, grads = grad_fn(x_ms, y_ms)
+    grad_ms = grads[0].asnumpy()
+    
+    assert np.allclose(grad_ms, grad_torch, atol=1e-3), "权重梯度不一致"
+
diff --git a/test/test_relu.py b/test/test_relu.py
new file mode 100644
index 0000000..977b30d
--- /dev/null
+++ b/test/test_relu.py
@@ -0,0 +1,139 @@
+import mindspore as ms
+import mindspore.mint.nn.functional as F_mint
+import numpy as np
+import pytest
+import torch
+import torch.nn.functional as F_torch
+from mindspore import Tensor
+
+np.random.seed(42)
+ms.set_seed(42)
+torch.manual_seed(42)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_relu_dtypes_support(mode):
+    """测试不同dtype输入的支持情况"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    ms_dtypes = [ms.int8, ms.int16, ms.int32, ms.int64, ms.uint8, ms.uint16, ms.uint32, ms.uint64, ms.float16, ms.float32, ms.float64, ms.bfloat16, ms.bool_]
+    torch_dtypes = [torch.int8, torch.int16, torch.int32, torch.int64, torch.uint8, torch.uint16, torch.uint32, torch.uint64, torch.float16, torch.float32, torch.float64, torch.bfloat16, torch.bool]
+
+    for i in range(len(ms_dtypes)):
+        ms_dtype = ms_dtypes[i]
+        torch_dtype = torch_dtypes[i]
+        
+        x_np = np.random.randn(2, 3)
+
+        # PyTorch
+        torch_support = True
+        try:
+            x_torch = torch.tensor(x_np, dtype=torch_dtype)
+            _ = F_torch.relu(x_torch)
+        except Exception as e:
+            print(e)
+            torch_support = False
+        
+        # MindSpore
+        ms_support = True
+        try:
+            x_ms = Tensor(x_np, ms_dtype)
+            _ = F_mint.relu(x_ms).asnumpy()
+        except Exception as e:
+            print(e)
+            ms_support = False
+
+        assert ms_support == torch_support, f"支持情况不同：ms_dtype: {ms_dtype} ({ms_support}), torch_dtype: {torch_dtype} ({torch_support})"''
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_relu_fixed_dtype_accuracy(mode):
+    """固定dtype测试输出一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+    
+    # PyTorch
+    x_torch = torch.tensor(x_np)
+    out_torch = F_torch.relu(x_torch)
+    
+    # MindSpore
+    x_ms = Tensor(x_np, ms.float32)
+    out_ms = F_mint.relu(x_ms)
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_relu_invalid_input(mode):
+    ms.set_context(mode=mode, device_target='Ascend')
+    """测试随机混乱输入，报错信息的准确性"""
+    
+    # 测试非Tensor输入
+    with pytest.raises(TypeError):
+        F_mint.relu(np.random.randn(2,3))
+
+class TorchReLUNet(torch.nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(3, 2)
+        self.linear.weight.data = torch.ones_like(self.linear.weight) * 0.5
+        self.linear.bias.data.fill_(0.1)
+    
+    def forward(self, x):
+        return F_torch.relu(self.linear(x))
+
+class MsReLUNet(ms.nn.Cell):
+    def __init__(self):
+        super().__init__()
+        self.linear = ms.nn.Dense(3, 2)
+        self.linear.weight.set_data(Tensor(np.full((2,3), 0.5), ms.float32))
+        self.linear.bias.set_data(Tensor([0.1, 0.1], ms.float32))
+    
+    def construct(self, x):
+        return F_mint.relu(self.linear(x))
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_relu_network_forward(mode):
+    """测试网络正向传播一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    
+    # PyTorch
+    torch_net = TorchReLUNet()
+    out_torch = torch_net(torch.tensor(x_np))
+    
+    # MindSpore
+    ms_net = MsReLUNet()
+    out_ms = ms_net(Tensor(x_np))
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "网络输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_relu_network_backward(mode):
+    """测试网络反向传播梯度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    y_np = np.array([0, 1])
+    
+    # PyTorch
+    torch_net = TorchReLUNet()
+    loss_fn = torch.nn.NLLLoss()
+    
+    x_torch = torch.tensor(x_np, requires_grad=True)
+    out_torch = torch_net(x_torch)
+    loss_torch = loss_fn(out_torch, torch.tensor(y_np))
+    loss_torch.backward()
+    grad_torch = torch_net.linear.weight.grad.detach().numpy()
+    
+    # MindSpore
+    ms_net = MsReLUNet()
+    loss_fn = ms.nn.NLLLoss()
+    
+    def forward_fn(x, y):
+        logits = ms_net(x)
+        return loss_fn(logits, y)
+    
+    grad_fn = ms.ops.value_and_grad(forward_fn, None, ms_net.trainable_params())
+    x_ms = Tensor(x_np)
+    y_ms = Tensor(y_np, ms.int32)
+    _, grads = grad_fn(x_ms, y_ms)
+    grad_ms = grads[0].asnumpy()
+    
+    assert np.allclose(grad_ms, grad_torch, atol=1e-3), "权重梯度不一致"
+
diff --git a/test/test_selu.py b/test/test_selu.py
new file mode 100644
index 0000000..b9bbd11
--- /dev/null
+++ b/test/test_selu.py
@@ -0,0 +1,139 @@
+import mindspore as ms
+import mindspore.mint.nn.functional as F_mint
+import numpy as np
+import pytest
+import torch
+import torch.nn.functional as F_torch
+from mindspore import Tensor
+
+np.random.seed(42)
+ms.set_seed(42)
+torch.manual_seed(42)
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_selu_dtypes_support(mode):
+    """测试不同dtype输入的支持情况"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    ms_dtypes = [ms.int8, ms.int16, ms.int32, ms.int64, ms.uint8, ms.uint16, ms.uint32, ms.uint64, ms.float16, ms.float32, ms.float64, ms.bfloat16, ms.bool_]
+    torch_dtypes = [torch.int8, torch.int16, torch.int32, torch.int64, torch.uint8, torch.uint16, torch.uint32, torch.uint64, torch.float16, torch.float32, torch.float64, torch.bfloat16, torch.bool]
+
+    for i in range(len(ms_dtypes)):
+        ms_dtype = ms_dtypes[i]
+        torch_dtype = torch_dtypes[i]
+        
+        x_np = np.random.randn(2, 3)
+
+        # PyTorch
+        torch_support = True
+        try:
+            x_torch = torch.tensor(x_np, dtype=torch_dtype)
+            _ = F_torch.selu(x_torch)
+        except Exception as e:
+            print(e)
+            torch_support = False
+        
+        # MindSpore
+        ms_support = True
+        try:
+            x_ms = Tensor(x_np, ms_dtype)
+            _ = F_mint.selu(x_ms).asnumpy()
+        except Exception as e:
+            print(e)
+            ms_support = False
+
+        assert ms_support == torch_support, f"支持情况不同：ms_dtype: {ms_dtype} ({ms_support}), torch_dtype: {torch_dtype} ({torch_support})"''
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_selu_fixed_dtype_accuracy(mode):
+    """固定dtype测试输出一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(3, 4).astype(np.float32)
+    
+    # PyTorch
+    x_torch = torch.tensor(x_np)
+    out_torch = F_torch.selu(x_torch)
+    
+    # MindSpore
+    x_ms = Tensor(x_np, ms.float32)
+    out_ms = F_mint.selu(x_ms)
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_selu_invalid_input(mode):
+    ms.set_context(mode=mode, device_target='Ascend')
+    """测试随机混乱输入，报错信息的准确性"""
+    
+    # 测试非Tensor输入
+    with pytest.raises(TypeError):
+        F_mint.selu(np.random.randn(2,3))
+
+class TorchSeLUNet(torch.nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.linear = torch.nn.Linear(3, 2)
+        self.linear.weight.data = torch.ones_like(self.linear.weight) * 0.5
+        self.linear.bias.data.fill_(0.1)
+    
+    def forward(self, x):
+        return F_torch.selu(self.linear(x))
+
+class MsSeLUNet(ms.nn.Cell):
+    def __init__(self):
+        super().__init__()
+        self.linear = ms.nn.Dense(3, 2)
+        self.linear.weight.set_data(Tensor(np.full((2,3), 0.5), ms.float32))
+        self.linear.bias.set_data(Tensor([0.1, 0.1], ms.float32))
+    
+    def construct(self, x):
+        return F_mint.selu(self.linear(x))
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_selu_network_forward(mode):
+    """测试网络正向传播一致性"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    
+    # PyTorch
+    torch_net = TorchSeLUNet()
+    out_torch = torch_net(torch.tensor(x_np))
+    
+    # MindSpore
+    ms_net = MsSeLUNet()
+    out_ms = ms_net(Tensor(x_np))
+    
+    assert np.allclose(out_ms.asnumpy(), out_torch.detach().numpy(), atol=1e-3), "网络输出不一致"
+
+@pytest.mark.parametrize('mode', [ms.GRAPH_MODE, ms.PYNATIVE_MODE])
+def test_selu_network_backward(mode):
+    """测试网络反向传播梯度"""
+    ms.set_context(mode=mode, device_target='Ascend')
+    x_np = np.random.randn(2, 3).astype(np.float32)
+    y_np = np.array([0, 1])
+    
+    # PyTorch
+    torch_net = TorchSeLUNet()
+    loss_fn = torch.nn.NLLLoss()
+    
+    x_torch = torch.tensor(x_np, requires_grad=True)
+    out_torch = torch_net(x_torch)
+    loss_torch = loss_fn(out_torch, torch.tensor(y_np))
+    loss_torch.backward()
+    grad_torch = torch_net.linear.weight.grad.detach().numpy()
+    
+    # MindSpore
+    ms_net = MsSeLUNet()
+    loss_fn = ms.nn.NLLLoss()
+    
+    def forward_fn(x, y):
+        logits = ms_net(x)
+        return loss_fn(logits, y)
+    
+    grad_fn = ms.ops.value_and_grad(forward_fn, None, ms_net.trainable_params())
+    x_ms = Tensor(x_np)
+    y_ms = Tensor(y_np, ms.int32)
+    _, grads = grad_fn(x_ms, y_ms)
+    grad_ms = grads[0].asnumpy()
+    
+    assert np.allclose(grad_ms, grad_torch, atol=1e-3), "权重梯度不一致"
+