プログラムの性能測定

実行時間をtimeなり何なりで測るのはいいとして、標準偏差によって実行回数を追加したりする必要はないんでしょうか? 実装/性能系の論文を見てもちゃんと書いてあるものが見当たりません。本当の「科学」の実験では重要というか常識ではないかと想像するのですが。