# 实验3-1 Tensors

实验目标：

* 初步掌握PyTorch的张量用法

张量(Tensor)是一种特殊的数据结构（可简单理解为高维数组），在使用方法上与数组或矩阵相似。在PyTorch中，我们使用张量来描述模型的输入、输出，以及模型参数。

张量类似于NumPy的ndarrays，并且张量可以在GPU上运行（或其他专用硬件），以实现加速计算。如果我们熟悉numpy.ndarray，就很容易掌握PyTorch的Tensor。


In [62]:
%matplotlib inline

In [63]:
import torch
import numpy as np

### 1. Tensor 初始化

张量可以通过多种方式初始化。请看以下示例：

#### 1.1 直接来自数据

张量可以直接从数据中创建。数据类型是自动推断的。

In [64]:
data = [[1, 2],[3, 4]]
x_data = torch.tensor(data)
print(x_data)
print(x_data.dtype)

tensor([[1, 2],
        [3, 4]])
torch.int64


#### 1.2 从NumPy数组创建

张量可以从NumPy数组创建（反之亦然）。

In [65]:
np_array = np.array(data)
x_np = torch.from_numpy(np_array)
print(x_np.dtype)

torch.int64


#### 1.3 来自另一个张量

新张量保留参数张量的属性（形状、数据类型），除非显式重写。



In [66]:
x_ones = torch.ones_like(x_data) # retains the properties of x_data
print(f"Ones Tensor: \n {x_ones} \n")
print(x_ones.dtype)
x_rand = torch.rand_like(x_data, dtype=torch.float) # overrides the datatype of x_data
print(f"Random Tensor: \n {x_rand} \n")
print(x_rand.dtype)

Ones Tensor: 
 tensor([[1, 1],
        [1, 1]]) 

torch.int64
Random Tensor: 
 tensor([[0.4114, 0.9433],
        [0.6890, 0.5708]]) 

torch.float32


#### 1.4 使用随机或常量值：

''shape'' 是张量维数的元组。在下面的函数中，它确定输出张量的维数。


In [67]:
shape = (2,3,)
rand_tensor = torch.rand(shape)
ones_tensor = torch.ones(shape)
zeros_tensor = torch.zeros(shape)
print(rand_tensor.dtype)
print(ones_tensor.dtype)
print(zeros_tensor.dtype)

print(f"Random Tensor: \n {rand_tensor} \n")
print(f"Ones Tensor: \n {ones_tensor} \n")
print(f"Zeros Tensor: \n {zeros_tensor}")

torch.float32
torch.float32
torch.float32
Random Tensor: 
 tensor([[0.3535, 0.5414, 0.5149],
        [0.7026, 0.4758, 0.2522]]) 

Ones Tensor: 
 tensor([[1., 1., 1.],
        [1., 1., 1.]]) 

Zeros Tensor: 
 tensor([[0., 0., 0.],
        [0., 0., 0.]])


> 请回答：
> 1. 采用以上各种方法创建Tensor时，其数据类型（即`.dtype`属性)是怎样的？

数据类型可在上面的输出中发现。

### 2. Tensor 属性


张量属性描述它们的形状、数据类型以及存储它们的设备。



In [68]:
tensor = torch.rand(5,4)

print(f"Number of dimension: {tensor.ndim}")
print(f"Shape of tensor: {tensor.shape}")
print(f"Datatype of tensor: {tensor.dtype}")
print(f"Device tensor is stored on: {tensor.device}")

Number of dimension: 2
Shape of tensor: torch.Size([5, 4])
Datatype of tensor: torch.float32
Device tensor is stored on: cpu


> 请回答：
> 1. 修改变量 tensor 的尺寸，重新执行，给出结果。
> 2. 并根据结果分析和解释`tensor.ndim`、`tensor.shape`、`tensor.dtype`和`tensor.device`各是什么含义？



分别为：维度、形状、数据类型、存储位置

### 3. Tensor 操作


* 在"官网文档<https://pytorch.org/docs/stable/torch.html>"中，详尽的介绍了约百余个张量的运算函数，包括转置、索引、切片、数学运算，线性代数，随机抽样等。

* 需知晓的是，这些函数都可以在GPU上运行。在批量化运行时，GPU运算速度通常比在CPU上运行的速度更高。



In [69]:
# We move our tensor to the GPU if available
if torch.cuda.is_available():
  tensor = tensor.to('cuda')

> 请回答：
> 1. 使用张量的任意操作函数，并给出代码和效果。
* 如果你熟悉NumPy API，你会发现Tensor API使用起来轻而易举。




In [70]:
print(tensor)
print(torch.acos(tensor))

tensor([[0.8814, 0.4445, 0.7783, 0.5680],
        [0.8376, 0.7283, 0.5712, 0.6707],
        [0.7175, 0.3082, 0.1837, 0.4545],
        [0.2929, 0.8227, 0.3114, 0.1816],
        [0.9362, 0.5050, 0.8165, 0.6510]], device='cuda:0')
tensor([[0.4919, 1.1102, 0.6788, 0.9667],
        [0.5779, 0.7550, 0.9628, 0.8356],
        [0.7705, 1.2575, 1.3861, 1.0990],
        [1.2735, 0.6047, 1.2541, 1.3882],
        [0.3591, 1.0414, 0.6154, 0.8619]], device='cuda:0')


### 4. 类似 numpy的索引(indexing)和切片(slicing) 

In [71]:
tensor = torch.ones(4, 4)
tensor[:,1] = 0
print(tensor)

tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])


> 请回答：
> 1. 请用索引或切片操作，给出`tensor`的第一行、第一列和中间2x2的子矩阵。

In [72]:
print(tensor[0])
print(tensor[:,0])
print(tensor[1:3,1:3])

tensor([1., 0., 1., 1.])
tensor([1., 1., 1., 1.])
tensor([[0., 1.],
        [0., 1.]])


### 5. 合并Tensor

合并Tensor有多种方式，例如`torch.cat`和`torch.stack`。

> 请回答：
> 1. 请查阅文档，并用示例描述`torch.cat`和`torch.stack`各是什么方式合并，有何不同。

In [73]:
t1 = torch.cat([tensor, tensor, tensor], dim=1)
print(t1)

tensor([[1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
        [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
        [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
        [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.]])


In [74]:
  #注: .cat 和 .stack的区别在于 cat会增加现有维度的值,，stack会新加增加一个维度
a=torch.Tensor([1,2,3])
print(torch.stack((a,a)))
print(torch.cat((a,a)))

tensor([[1., 2., 3.],
        [1., 2., 3.]])
tensor([1., 2., 3., 1., 2., 3.])


### 6. Tensors相乘



In [75]:
# This computes the element-wise product
print(f"tensor.mul(tensor) \n {tensor.mul(tensor)} \n")
# Alternative syntax:
print(f"tensor * tensor \n {tensor * tensor}")

tensor.mul(tensor) 
 tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]]) 

tensor * tensor 
 tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])


这将计算两个张量之间的矩阵乘法


In [76]:
print(f"tensor.matmul(tensor.T) \n {tensor.matmul(tensor.T)} \n")
# Alternative syntax:
print(f"tensor @ tensor.T \n {tensor @ tensor.T}")

tensor.matmul(tensor.T) 
 tensor([[3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.]]) 

tensor @ tensor.T 
 tensor([[3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.]])


> 请回答：
> 1. 请查阅文档，并结合示例，说明以上两种乘法的区别

一种是按元素相乘，一种是矩阵乘法

### 7. 就地（In-place）操作

> 就地操作是指，操作的输入和输出都是同一个变量。例如C语言中的`x++`和`y*=5`都属于就地操作。由于就地操作避免了内存拷贝，可以提升运算速度。


具有`_`后缀的成员函数即为就地操作。例如：`x.copy_(y)`、`x.t_()`执行后将都将更改变量`x`。

In [77]:
print(tensor, "\n")
tensor.add_(5)
print(tensor)

tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]]) 

tensor([[6., 5., 6., 6.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.]])


注意：

就地操作虽然可节省一些内存，但在计算梯度时可能会出现问题。因为就地操作会丢失计算的历史。因此，不鼓励使用它们。


> 请回答：
> 1. 请尝试`x.copy_(y)`函数，并说明其用法。


In [78]:
#将y复制到x中
x = torch.tensor([[1, 2],[3, 4]])
print(x)
y = torch.tensor([[4, 3],[2,1]])
print(y)
x.copy_(y)
print(x)

tensor([[1, 2],
        [3, 4]])
tensor([[4, 3],
        [2, 1]])
tensor([[4, 3],
        [2, 1]])


### 8. 与 NumPy 间的转换

Torch的Tensor可以和NumPy的ndarray互相转换。

若Tensor是在CPU上，那么其转换所得 NumPy 数组可与之共享其底层内存。也就是，更改其中一个将导致另一个也被更改。

#### 8.1 Tensor 转为 NumPy array




In [79]:
t = torch.ones(5)
print(f"t: {t}")
n = t.numpy()
print(f"n: {n}")

t: tensor([1., 1., 1., 1., 1.])
n: [1. 1. 1. 1. 1.]


张量的更改亦反映在NumPy数组中。


In [80]:
t.add_(1)
print(f"t: {t}")
print(f"n: {n}")

t: tensor([2., 2., 2., 2., 2.])
n: [2. 2. 2. 2. 2.]


#### 8.2 NumPy array 转为 Tensor

In [81]:
n = np.ones(5)
t = torch.from_numpy(n)

更改NumPy数组亦影响张量。



In [82]:
np.add(n, 1, out=n)
print(f"t: {t}")
print(f"n: {n}")

t: tensor([2., 2., 2., 2., 2.], dtype=torch.float64)
n: [2. 2. 2. 2. 2.]


> 请回答：
> 1. 请查阅文档，以了解如何复制Tensor或ndarray，以避免内存共享时的干扰。请给出示例代码。

In [83]:
#使用clone方法
a = torch.ones(3)
b = a.numpy()
a.add_(1)
print(a)
print(b) #a和b共享内存

a = torch.ones(3)
b = a.clone().numpy()
a.add_(1)
print(a)
print(b) #a和b不共享内存

tensor([2., 2., 2.])
[2. 2. 2.]
tensor([2., 2., 2.])
[1. 1. 1.]
