如果只想使用numpy,则可以使用 结构化数组
和
lib.recfunctions.join_by函数(请参见http://pyopengl.sourceforge.net/pydoc/numpy.lib.recfunctions.html)。一个小例子:
In [1]: import numpy as np ...: import numpy.lib.recfunctions as rfn ...: a = np.array([(1, 10.), (2, 20.), (3, 30.)], dtype=[('id', int), ('A', float)]) ...: b = np.array([(2, 200.), (3, 300.), (4, 400.)], dtype=[('id', int), ('B', float)])In [2]: rfn.join_by('id', a, b, jointype='inner', usemask=False)Out[2]: array([(2, 20.0, 200.0), (3, 30.0, 300.0)], dtype=[('id', '<i4'), ('A', '<f8'), ('B', '<f8')])
另一种选择是使用 pandas
(文档)。我没有经验,但是它提供了比标准numpy更强大的数据结构和功能,“使使用“关系”或“标签”数据既简单又直观”。而且它当然具有联接和合并功能(例如,请参见http://pandas.sourceforge.net/merging.html#joining-
on-a-key)。