Nie jestem pewien co do metody view () w poniższym fragmencie kodu.
class Net(nn.Module):
def __init__(self):
super(Net, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2,2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16*5*5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16*5*5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
net = Net()
Moje zdezorientowanie dotyczy następującej linii:
x = x.view(-1, 16*5*5)
Do czego służy funkcja tensor.view ()? Widziałem jego użycie w wielu miejscach, ale nie rozumiem, w jaki sposób interpretuje jego parametry?
Co się stanie, jeśli podam wartości ujemne jako parametry funkcji view ()? Na przykład, co się stanie, jeśli wywołam, tensor_variable.view (1, 1, -1)
?
1 odpowiedź
Funkcja widoku ma na celu przekształcenie tensora.
Powiedz, że masz taki tensor:
import torch
a = torch.range(1, 16)
a jest tensorem, który ma 16 elementów od 1 do 16 (w zestawie). Jeśli chcesz przekształcić ten tensor, aby był tensorem 4 x 4, możesz użyć
a = a.view(4, 4)
Teraz a będzie tensorem 4 x 4. Pamiętaj, że po zmianie kształtu całkowita liczba elementów musi pozostać taka sama. Przekształcenie tensora a w tensor 3 x 5 nie byłoby właściwe.
Jakie jest znaczenie parametru -1? Jeśli istnieje jakakolwiek sytuacja, w której nie wiesz, ile wierszy chcesz, ale jesteś pewien liczby kolumn, możesz to określić za pomocą -1. (Należy zauważyć, że można to rozszerzyć na tensory o większej liczbie wymiarów. Tylko jedna wartość osi może wynosić -1).
Można to zobaczyć w powyższym kodzie sieci neuronowej. Po linii x = self.pool (F.relu (self.conv2 (x)))
w funkcji przewijania pojawi się mapa cech głębokości 16. Musisz go spłaszczyć, aby uzyskać w pełni połączoną warstwę. Mówisz pytorchowi, aby przekształcił uzyskany tensor tak, aby miał określoną liczbę kolumn, i sam decyduje o liczbie wierszy.
Rysując podobieństwo między numpy i pytorch, widok jest podobny do funkcji przekształcania numpy.