BDAL-RUC 科研地图
我们围绕大规模统计计算、代表性设计、Hilbert/空间填充曲线传输度量、最优传输几何、跨域软对齐,以及工业与 AI 系统中的统计方法展开研究,目标是在理论可解释性和真实计算效率之间建立可复用的方法框架。
32已收录论文
1 / 3 / 15人大 A+ / A / A- 类期刊
5NeurIPS / ICML / ICLR
代表性工作 SparSink HCPD POTD Core-Elements SEINT MP-MoE
快速导航
大规模子抽样、稀疏化与代表性设计
从样本级抽样到元素级、算子级和交互级稀疏化。
Hilbert / 空间填充曲线传输度量用低维排序、质量坐标和原空间计价连接效率与几何。
最优传输几何、降维与不变表示把 OT 作为几何代理、判别方向和不变表示的统一工具。
跨域软对齐与应用型 OT用 OT/UOT 生成软对应,服务跨域推断、配准和代表对象构造。
工业与 AI 系统中的统计方法把统计计算和功能单元选择转化为图像、深度学习与 MoE 系统中的可用算法。
综述与背景入口梳理子抽样、投影最优传输和 OT 稀疏化的技术谱系。
其它论文与低权重补充收录区间值对象、应用合作和不适合强行归入主线的相关工作。
按主线浏览论文
大规模子抽样、稀疏化与代表性设计
这一主线关注代表性设计、子抽样和元素/交互级稀疏化,在保持统计性质的同时降低大规模计算成本。
TL;DR: 用单侧元素稀疏化近似协方差结构,重写 kernel PLS 以加速大规模 PLS。
Core-Elements Subsampling for Alternating Least Squares
TL;DR: 将元素级子抽样嵌入交替最小二乘更新,在控制误差的同时加速矩阵分解。
Sampling-Based Methods for Multi-Block Optimization Problems over Transport Polytopes
TL;DR: 在多块输运多胞形中构造采样求解策略,降低多边际结构优化成本。
Nonparametric Additive Models for Billion Observations
TL;DR: 把元素级稀疏化扩展到超大规模加性模型,并配套重写惩罚估计与调参准则。
Core-Elements for Large-Scale Least Squares Estimation
TL;DR: 将抽样单位从样本行下钻到矩阵元素,并重写估计器以保持大样本性质。
An Optimal Transport Approach for Selecting a Representative Subsample with Application in Efficient Kernel Density Estimation
TL;DR: 用最优传输构造代表性子样本,提升核密度估计中的分布覆盖效率。
Importance Sparsification for Sinkhorn Algorithm
TL;DR: 从最优传输结构中推出可计算采样上界,稀疏化 Sinkhorn 的成对交互。
Efficient Approximation of Gromov-Wasserstein Distance Using Importance Sparsification
TL;DR: 将 SparSink 的重要性稀疏化思想推广到 Gromov-Wasserstein 距离计算。
LowCon: A Design-Based Subsampling Approach in a Misspecified Linear Model
TL;DR: 在模型错设场景下,用空间填充式子抽样提升估计的稳健性与覆盖性。
More Efficient Computation of Smoothing Splines via Space-Filling Basis Selection
TL;DR: 用低差异空间填充基函数选择,加速 smoothing splines 的近似计算。
Hilbert / 空间填充曲线传输度量
这一主线利用 Hilbert 曲线和空间填充曲线的排序与局部性,为分布比较和高维几何计算提供轻量结构。
Efficient Variants of Wasserstein Distance in Hyperbolic Space via Space-Filling Curve Projection
TL;DR: 用空间填充曲线生成双曲空间中的轻量耦合,保留原始几何距离计价。
Hilbert Curve Projection Distance for Distribution Comparison
TL;DR: 用 Hilbert 排序生成传输耦合,再回到原空间计价以构造分布比较距离。
Smoothing Splines Approximation Using Hilbert Curve Basis Selection
TL;DR: 用 Hilbert 曲线排序做基函数选择,在多维 smoothing spline 中兼顾覆盖与效率。
最优传输几何、降维与不变表示
这一主线把最优传输视为几何代理,用于方向恢复、投影追踪、特征筛选和刚体不变度量。
An Efficient SE(p)-Invariant Transport Metric Driven by Polar Transport Discrepancy-Based Representation
TL;DR: 构造信息保持的刚体不变表示,在保持 SE(p) 不变性的同时得到低成本输运度量。
Scalable Model-Free Feature Screening via Sliced-Wasserstein Dependency
TL;DR: 用切片 Wasserstein 依赖度量做无模型特征筛选,捕捉非线性变量重要性。
Sufficient Dimension Reduction for Classification Using Principal Optimal Transport Direction
TL;DR: 用类别分布间的最优传输位移作为代理,恢复分类中的充分降维方向。
Large-Scale Optimal Transport Map Estimation Using Projection Pursuit
TL;DR: 用残差驱动的投影追踪方向,逐步构造高维最优传输映射近似。
跨域软对齐与应用型 OT
这一主线用 OT/UOT/partial OT 生成软对应或代表对象,服务无配对推断、图像配准和 3D 表示压缩。
Iterative Optimal Transport for Multimodal Image Registration
TL;DR: 将多模态图像配准写成变换估计与非平衡最优传输软对齐的交替优化。
Double Optimal Transport for Differential Gene Regulatory Network Inference with Unpaired Samples
TL;DR: 在无配对样本中用两层最优传输生成软对应,服务差异基因调控网络推断。
Gaussian Herding Across Pens: An Optimal Transport Perspective on Global Gaussian Reduction for 3DGS
TL;DR: 从最优传输角度压缩 3D Gaussian 表示,减少冗余 Gaussian 成分。
工业与 AI 系统中的统计方法
这一主线面向真实应用场景,把统计计算、杠杆近似、主动学习和功能单元选择转化为可部署算法。
Breaking the Echo Chamber: A Dynamic Ensemble Pruning Perspective on MoE
TL;DR: 把 MoE expert routing 看成功能单元剪枝,选择强且互补的专家缓解回音室效应。
SPOT: An Active Learning Algorithm for Efficient Deep Neural Network Training
TL;DR: 用主动学习选择高价值样本,提升深度神经网络训练效率。
Efficient Approximation of Leverage Scores in Two-Dimensional Autoregressive Models with Application to Image Anomaly Detection
TL;DR: 用二维自回归结构近似杠杆分数,服务图像异常检测中的高效抽样。
综述与背景入口
这些论文作为研究背景入口,帮助读者理解大规模子抽样、投影最优传输和最优传输稀疏化的技术谱系。
Sparsification Techniques for Large-Scale Optimal Transport Problems
TL;DR: 梳理大规模最优传输稀疏化方法,作为 SparSink 系列工作的背景入口。
Projection‐Based Techniques for High‐Dimensional Optimal Transport Problems
TL;DR: 梳理投影型高维最优传输技术,作为 sliced/projection OT 的背景入口。
Modern Subsampling Methods for Large-Scale Least Squares Regression
TL;DR: 梳理大规模最小二乘子抽样方法,作为 leverage 与 optimal subsampling 的背景入口。
Effective Statistical Methods for Big Data Analytics
TL;DR: 综述大数据分析中的统计建模与计算方法,作为早期背景入口。
其它论文与低权重补充
这些论文与团队研究、应用合作或几何统计补充方向相关,但不强行归入核心主线。
Hausdorff Correlation for Interval-Valued Random Objects
TL;DR: 为区间值随机对象构造相关性度量,作为几何型依赖分析的补充工作。
Leverage Classifier: Another Look at Support Vector Machine
TL;DR: 从杠杆分数视角重新理解支持向量机分类器。
AppleQSM: Geometry-Based 3D Characterization of Apple Tree Architecture in Orchards
TL;DR: 面向果园苹果树三维结构,构建基于几何的表征与量化方法。
A Hausdorff Regression Paradigm for Interval Privacy
TL;DR: 围绕区间值隐私数据建立 Hausdorff 回归建模框架。
High-Resolution 3D Terrestrial LiDAR for Cotton Plant Main Stalk and Node Detection
TL;DR: 应用高分辨率 3D LiDAR 表征棉株主茎与节点结构。
