Skip to content

实习面经

商汤科技_多模态大模型算法实习生

时间:2024-07

一面:

  1. 自我介绍
  2. 具体介绍论文
  3. 介绍医学影像分割项目
  4. 是否了解多模态:GRES广义表达式分割
  5. 算法:给定一个字符串,按字符出现频率逆序输出,如输入"tree",输出"eert"

二面:

  1. 自我介绍

  2. BN和LN有什么区别

  3. pytorch中train模式和eval模式有什么区别

    1.BN层:训练模式下,Batch Normalization 层会使用当前批次的数据来计算均值和方差,并更新其内部的运行均值和方差。评估模式下Batch Normalization 层会使用训练过程中积累的运行均值和方差(而不是当前批次的统计量)来标准化输入数据。这样可以确保评估时的一致性。

    2.Dropout层:训练模式下使用dropout层,防止过拟合,评估模式下不使用

    3.训练模式启动各种训练机制进行参数更新,评估模式不更新任何参数,仅仅进行前向传播

  4. 现在希望在训练时让某部分不进行梯度的更新,有哪些办法

    1.冻结特定层的参数:可以将这些层的参数的 requires_grad 属性设置为 False

    2.在前向传播中使用 with torch.no_grad()

    3.在定义优化器时,选择性地只更新需要更新的参数

  5. pytorch中的多进程和多线程有什么区别?

    多线程适合 I/O 密集型任务(如文件读写、网络操作),因为这些操作主要依赖于等待,而不完全占用 CPU 资源。

    多进程适合 CPU 密集型任务(如复杂的数值计算、深度学习模型训练),因为它能更好地利用多核 CPU 的计算能力。

  6. 论文是怎么进行加速的

  7. 有没有使用多GPU同时训练的经验

  8. 能不能接受数据标注的工作

  9. 实习时长多少

  10. 算法:力扣原题,200.岛屿数量

  11. 反问:最晚入职时间(避雷该问题)

得物_图像算法实习生

时间:2024-07

一面:

  1. 自我介绍

  2. 刚性变换是什么,怎么做的

    意思是在处理视频时,对人体的关节进行平移、旋转和镜像等操作,使得关节在时间序列中保持稳定的位置和方向,而不发生形状的扭曲或缩放,可以更精确的捕捉和分析人体的运动特征,从而实现更精确的姿势估计和动作识别。

    刚性变换由旋转矩阵和平移向量组成。它不会改变物体的形状或大小,只会改变物体的位置和方向。通过旋转矩阵和平移向量对关节位置和与关节相关的连杆进行旋转和平移

  3. 人体不属于刚体,你是如何保证刚性变换后的关节点能够对应到原始序列的关节点

    每个关节可以被视为在其局部坐标系中进行变换,而不是在全局坐标系中变换。这意味着每个关节的刚性变换是相对于其父关节的。每个关节点的变换都依赖于父节点的变换,根据父节点变换的位置计算该点变换后的相对位置,通过这种方式,关节的变换会被递归地应用,并且总能保证关节点对应到正确的位置。

  4. 你这个核心网络TRes-NeRF的设计,这个时间残差是如何设计的,为什么要这样设计

  5. 你这个医学影像分割的项目有针对数据集中的一些bad case做了对应的改进吗

  6. 看你打过算法比赛,平时有练习算法吗

  7. 传统方法的三维重建、NeRF和3dgs相比,问题在哪里?或者说3dgs的优势在哪里

    1.NeRF 需要对每个像素的3D空间点进行采样,无法实现实时渲染速度。3dgs通过稀疏的点云表示,以每个点为中心去生成3d高斯,然后通过溅射操作投影到二维平面进行快速渲染

    2.3dgs作为显示表达,最终的输出即为重建之后的图像,由SFM建立得到的稀疏三维点云,在建模成3D高斯后,3D高斯中明确的包含了三维世界的信息(位置,颜色,不透明),可以直接用于渲染不需要经过复杂的神经网络推断

  8. 为什么NeRF重建得到的结果转化为mesh时质量较差

    NeRF的核心是对场景的隐式表示,在给定的视角下输出场景中的颜色和密度。换句话说,NeRF主要是在连续的三维空间中建模光线和颜色分布,而不是显式建模几何形状。直接输出的是图像或光线方向的颜色和密度值,而不是明确的几何信息,因此很难直接从NeRF模型中提取出高质量的几何结构。以及NeRF采用的体渲染需要密集采样以获取高质量的重建效果,这导致了计算量大、内存占用高等问题。

  9. 有没有读研的打算

  10. 算法手撕:

python
给定两个数组arr1,arr2,对arr1进行相对排序,排序规则为将按照arr2中出现的元素顺序进行排序,arr2中没有出现的元素,按照升序排在最后
  1. 反问:具体业务:主要做视觉以及多模态领域的商品质检、真品鉴别和三维重建

    ​ base哪里:主要岗位在上海,部分岗位在杭州,上海主要做鉴别,杭州做质检

爱奇艺机器学习算法

时间:2024-07

一面:

  1. 自我介绍
  2. 纯问项目,hr基本什么都不懂,kpi无疑

无手撕

依图科技_多模态视觉算法实习生

时间:2024-08

一面:

  1. 自我介绍
  2. 手撕:LeetCode 54.螺旋矩阵
  3. 思路:LeetCode 41.缺失的第一个正数
  4. 问项目:拷打论文
  5. 反问:业务、还有几轮、需要改善的地方

二面:

  1. 自我介绍
  2. 手撕:LeetCode 560.和为k的子数组 + 改进:输出区间下标并判断数组全为0和target也为0的时间复杂度
  3. 问项目:拷打论文
  4. 能否接受杭州
  5. 反问:业务、还有几轮

最后更新时间:2025-05-18 16:48:14

Visitor: