CS149 Lab Assignment1

约 998 字大约 3 分钟

Prog1_mandelbort_threads

环境配置

本人使用OS为Ubuntu 22.04, 还是建议使用Linux系统做Lab, 很多环境配置会方便一些.

CS149_Asst1并不需要额外配置运行环境, 下载解压一下编译环境就好啦!
下载包:

    wget https://github.com/ispc/ispc/releases/download/v1.21.0/ispc-v1.21.0-linux.tar.gz

解压包:

    tar -xvf ispc-v1.21.0-linux.tar.gz

配置环境路径:

    export PATH=$PATH:${HOME}/Downloads/ispc-v1.21.0-linux/bin

环境配置完成后就可以clone repo到本地来开始lab了:

    git clone https://github.com/stanford-cs149/asst1.git

任务分析

Pro1的内容主要是为了让学生了解std::thread的并行机制和"多线程不一定高效率"的并发事实, 所以难度并不算大~~(这是我的事后诸葛亮)~~, 整体框架已经在源码中基本完成了.完成后可以通过make + ./mandelbort --<args>检验正确与否.

task :

创建线程0和线程1, 分别计算图像的上下两个部分, 即将图像的不同空间交给不同线程计算, 这被称为空间分解(spatial decomposition).
扩展代码使其能够使用2, 3, 4, 5, 6, 7, 8个线程, 进行空间分解, 生成加速图, 假设加速是否与线程数线性相关并加以验证.
在workerThreadStart()的开头和结尾插入计时代码, 验证并解释task2中提出的猜想.
修改一开始的线程分配方式, 实现将两个图片都拉到8线程时7-8倍加速比的效果, 找到适应任何线程数的泛型分配方式(不需要线程之间进行响应和同步), 报告最后得出的8线程加速比.
使用16个线程运行改进后代码, 回答性能是否明显高于8线程并解释原因.

事实上task中给的提示还是比较明显的, 在task1中解释了空间分解的概念, 那么通过对图片本身的上下多份分割,就可以解决这个问题,要注意分割的时候会不会漏行.

任务实现

我们将一开始就对任务给出多线程的解决方式, 并在后续针对数据结果决定是否要进行优化.

首先我们可以根据阅读mandelbrotSerial.cpp中的源码, 得到mandelbrotSerial()函数事实上是用来计算Mandelbrot图像的, 可以简单分析一下mandelbrotSerial()函数的各个参数:

    void mandelbrotSerial(
    float x0, float y0, float x1, float y1, // 复平面左上和右下两个点坐标
    int width, int height,                  // 图像宽度和高度
    int startRow, int numRows,              // 开始行和总计算行数
    int maxIterations,                      // 最大迭代次数
    int output[]);                          // 每个点的迭代次数

不难发现只要我们给出startRow, numRows, 其余保持图像默认参数, 就可以完成计算了.
所以可以给出函数workerThreadStart(WorkerArgs * const args)的代码:

    size_t rows = args -> height / args -> numThreads;          // 确定要计算的行数
    if (args -> height % args -> numThreads) {                  // 如果该遇到整除要加一行避免遗漏
        rows++;
    }
    size_t startRow = args -> threadId * rows;                  // 确定开始行
    // 如果已经到最后部分不够切分, 直接处理最后部分
    rows = rows > args -> height - startRow ? args -> height - startRow : rows;
    // 调用mandelbrotSerial
    mandelbrotSerial(args -> x0, args -> y0, args -> x1, args -> y1, args -> width, 
                    args -> height, startRow, rows, args -> maxIterations, args -> output);