通过动作和声音获取图画