高通量原位结构解析软件包 高通量原位结构解析算法主要用于细胞原位等具有叠合蛋白密度样品的目标蛋白结构解析,该算法基于相关性分析,通过施加最优的权重函数,可以在单张冷冻电镜数据上实现目标蛋白质的定位以及高分辨结构解析。由于无需断层重构,原位结构解析的数据采集通量提升了数十倍。

Manual

要运行可执行程序,需要安装EMAN1.9软件包。若自行编译,除了要安装EMAN 1.9,还要检查g++版本,4.8和5.x版本运行良好,但6.3版本会出现错误。使用流程如下:

  1. 两个指数函数拟合功率谱的典型SSNR参数已给出 -- ssnr.txt。前三个参数是对噪声谱的估计,后三个参数是对信号谱的估计。
  2. 在预处理二维图像之前,你应该已经取得了一个包含CTF参数的.lst格式的图像文件。然后用我们的优化加权函数对该文件中列出的原始图像进行滤波。具体用法可以通过在程序后输入回车键找到。这个操作将生成过滤后的图像和相关的图像文件,格式为.lst。在输出的.lst文件上运行lstfast.py。
  3. 通过使用 "do_global_detection_with_my_weight "程序在过滤后的图像中探测目标蛋白。输入文件是步骤2中的.lst输出文件。参数--阈值由每个数据集决定,你可以在一个图像上以阈值0运行这个程序,根据分数的分布选择一个合适的值作为阈值。常数-kk必须与你在步骤2中使用的相同。
  4. 程序的输出呈现出一大组位置和方向,然后我们需要根据它们的平移和旋转来合并相邻的解决方案。
  5. 通过执行以下程序将每个 locations_and_orientations_file 从过滤后的图像转换为原始图像。"read_my-output_write_lst.py merged_ locations_and_orientations_file original_ image_file scale_factor output.lst",如果过滤后的图像没有被重新缩放,缩放系数为1,否则取决于缩放比例。在输出文件上运行lstfast.py。
  6. 通过以下操作从原始图像中提取潜在的粒子。"e2proc2d.py output_of_step5 ???.spi --process=xform.centerbyxform -clip=particle_size,particle_size"
  7. 用 "convert_to_particle_file.py ???.spi particle_file.lst boxsize 0 "将output_of_step5转换为粒子文件。
  8. 将.lst格式的particle_file转换为reison(.star)格式,用于3D分类。"lstfile_2_relion_class3d.py particle_file.lst ???.spi boxsize pixel_value particle.star metadata_line 0",metadata_line是lstfile中粒子前的行数。
  9. 运行non-alignment三维分类。
  10. 根据三维分类选择适当的颗粒进行局部自动优化。
  11. 如果存在模型偏差效应,你需要做以下操作。首先,通过使用 "relion2lst_dont_write_particles.py refined_data.star -lst refined_data.lst -boxsize boxsize "将relion star文件转换为EMAN lst文件。 其次,计算每个粒子和由局部自动精炼的3D地图生成的投影之间的相位残差。你可以执行jalign或我们自己的程序 "calculate_cc_with_fsc -F FSC_file -a pixel_size -v acceleration voltage -H high_resolution_threshold -L low_resolution_threshold -r 3D_map -i refined_data.lst -f first_image_number -l last_image_number -R mask_radius_in_pixel -u soft_edge -o out.lst -c 0" 。第三,运行 "sort_by_score.py out.lst number_of_particle_to_stay metadata_line scored.lst" 最后,按照步骤8的建议将lst文件转换为relion star文件,并进行局部自动优化。