Re: How to get all occurrences of duplicate record...

NhatHoang · ‎11-30-2022

Hi,

In my experience, if you use dropDuplicates(), Spark will keep a random row.

Therefore, you should define a logic to remove duplicated rows.